当前位置:首页 > 科技资讯 > 正文

具身智能在2025年的演进:从技术突破到产业落地的挑战与机遇

具身智能在2025年的演进:从技术突破到产业落地的挑战与机遇 具身智能  人工智能 机器人技术 产业化应用 第1张

12月初,国内两所顶尖高校相继设立具身智能专业,这被视为产业界与学术界的一次深度协作,激发了公众对国产具身智能美好前景的憧憬。

12月8日,智元机器人宣布实现5000台产品的量产。2025年成为中国具身智能高速发展的一年,从年初亮相春晚,到年末进入高等学府。具身智能领域的参与者不断增多,对其内涵的理解也日益多元化。

部分观点认为,具身智能是AI的实体化呈现;另一些观点则视其为新型交互模式。虽然难以达成统一界定,但共识在于:具身智能与每个人紧密相关。

具身智能的局限性在哪里?

在大模型时代,所有工业体系都面临重构。

乐观者提出:"具身智能有什么不能完成?"

旁观者观察到:"具身智能可折叠衣物、处理物流、踢足球、吸引眼球,甚至更多......"

然而,丰富的演示与实际应用之间仍存在显著差距。为争取融资,具身智能企业竭力展示"想象力",演示或许能体现特定能力,但不同演示未必代表算法能力的差异。当前行业出现"横向扩展"演示现象,即所有"创新"实为相似元素的组合,营造出虚假繁荣。这一矛盾凸显了具身智能扩张与技术积累的平衡困境;过度深入的技术积累会导致投资高昂、成果难产,最终面临淘汰。

演示遍布各地,但直至12月,具身智能仍未大规模落地。首要原因在于其能力尚未达到规模化门槛。评估具身智能需考察简单任务的成功率、效率、成本与可靠性。

尽管在高度结构化的实验环境中,部分具身智能表现稳定,任务成功率可能超过80%,但置于真实场景时成功率常大幅下滑。更关键的是,即便单个任务成功率提升,对于长链条任务,总成功率为各环节成功率的乘积,而小于1的数值相乘结果必然更低。

具身智能的真正落地既需寻找适用场景,也需确保成功率提高。这条路径的时长尚未明确,但可确定的是,具身智能的规模增长与演示增长并非绝对正相关。类似"狼来了"的典故,人们曾在2015年听闻"这一年是具身智能的元年"。

具身智能的ChatGPT时刻

具身智能需在现实世界广泛应用,吸引大众使用,才会迎来类似ChatGPT的爆发点。

资本急于开拓具身智能应用场景,但企业仍在探索具体应用方式与领域。12月3日,特斯拉展示了机器人奔跑视频。是的,具身智能能够奔跑,但后续呢?何种场景需要机器人替代人类跑步?

产业界将具身智能未来落地方向归纳为三类:商业服务、工业应用与家庭场景。落地顺序很可能从商业服务开始,再到工业服务,最后进入家庭。

这一顺序主因具身智能需要大量数据训练以构建世界模型。在此模型中,具身智能需具备思考与预测能力。然而,这类似鸡与蛋的问题:缺乏实际场景数据采集机会,就难以快速建立模型。商业场景尤其是酒店类,环境相对固定易于训练,且送餐机器人确实能降低人力成本。

工业场景对效率要求极高,替代自动化的效率是硬性指标。即使机器人能精准复刻某些工业操作,相比人手,其速度并无优势。从用户角度,购买更慢的"人力资源"属于亏损交易;从技术角度,工业场景碎片化导致数据收集困难,难以规模化,从而更难突破成本与效率限制。

最后,谈及家庭服务。对具身智能进入家庭的前景存在两极看法:若仅需陪伴与对话功能,具身智能可能快速进入消费领域。毕竟从智能家居到AI玩具,人机交互已不罕见。但若具身智能要成为家庭"成员",则面临安全与成本问题。尤其应用于医疗、养老等场景时,安全性需更为审慎。

具身智能的普及路径大致从专精到通用:初期实现单场景单任务的稳定执行;随后过渡到单场景多任务;最终达成多场景多任务的稳定执行。

具身智能的发展也需行业共识,即一套基准测试,运动式竞赛无法揭示真实差距。这一点突破需要产学研结合。学界方面,除清华大学、上海交大已增设具身智能专业,另有一批国内高校正在申请该专业。

具身智能的繁荣与焦虑

千百年来,人类一直梦想创造能自动完成需智慧与能力之工作的人工产物。

在荷马史诗《伊利亚特》中,锻神赫菲斯托斯制造了金属机器人与黄金仆从协助杂务。亚里士多德预言了自动化工具的出现,使劳动不再必要。《列子》记载工匠偃师为周穆王制作了生动逼真、能歌善舞、甚至蕴含情感的"机关人偶"。《格列佛游记》描述了一种机械装置,使得"最无知者也能撰写哲学、诗歌、政治、法律、数学与神学著作,无需天赋或学习"。

以往,人们对具身智能的期望总是替代人类从事单调、重复、低价值工作;同时担忧其演变为"掌控"人类的存在,2025年AI对人力资源的冲击印证了这一点。因此具身智能的未来未必是替代重复性劳动,或许让其替代人类执行危险任务更具意义。

尽管对具身智能的未来存在焦虑,但其带动了多个产业的繁荣。对芯片行业而言,众多厂商找到了产品新增长点。

边缘端,多家国产芯片厂商发布具身智能产品。极海推出G32R501实时控制MCU,满足具身机器人在感知决策、运动控制及高效人机交互等方面的高算力、高效率与高精度需求。以"MCU+Driver+IPM"全栈式电机专用芯片为核心,搭配自研电机算法平台,可应用于机器人关节、工业编码器、无框力矩电机等核心场景,构建具身智能"神经中枢"。

国民技术N32H7系列MCU凭借多核异构架构与超高主频,提供强大算力与实时响应能力,满足人形机器人对复杂控制与高同步性的严苛要求。内置CORDIC协处理器高效完成运动学涉及的三角/坐标变换等数学计算,显著减轻CPU负载。

全志科技MR系列机器人芯片采用12nm制程,集成CPU+GPU+NPU异构架构,算力达3-4TOPs,功耗仅5W,支持毫秒级响应,为小米CyberDog、宇树Unitree系列等产品提供运动控制与环境感知核心算力,成本仅为英伟达Jetson Nano的三分之一。

瑞芯微RK3588采用八核64位ARM架构,4颗Cortex-A76高性能内核(主频2.4GHz)与4颗Cortex-A55能效内核(主频2.0GHz)组合,多任务处理与复杂计算能力出色。内置6TOPS算力NPU,支持多种数据类型与主流深度学习框架,高效处理图像识别、语音交互等AI任务。业内人士透露,瑞芯微面向具身智能行业已出货上万片相关产品。

佰维存储表示已推出适用于具身智能领域的eMMC、UFS、BGA SSD、LPDDR4X/5/5X等产品,并积极拓展头部客户。据第三方拆解报告,宇树科技Go2智能机器狗中已应用佰维存储的LPDDR4X、eMMC存储产品。

算力端,英特尔、英伟达仍是机器人"头部"算力核心供应商。如前所述,具身智能的VLA需构建世界模型,模型构建必然带动算力需求。英特尔通过推出GPU+NPU+CPU异构系统,满足运动控制、AI推理的不同负载要求,实现VLA模型运行。

此外,英伟达推出NVIDIA Cosmos平台以加速物理AI。该平台能整合前沿生成式世界基础模型(WFM)、先进分词器、护栏及高效数据处理管理流程,为世界模型训练提供支持,加速智能汽车(AV)和机器人的物理AI开发。

由于涉及机械控制、边缘算力等环节,具身智能芯片供应商与汽车芯片供应商高度重合。具身智能的发展与汽车历程也有相似之处。

1885年,卡尔·本茨制造了首辆汽油内燃机驱动的三轮车。或许,机器人当前的"社会角色"如同1900-1910年的汽车:是技术奇迹,却非社会基础设施。如今汽车已普及,具身智能的发展还需时间,但不会长达百年。

可以肯定的是,具身机器人角色尚未定型,但并非能力不足。