当前位置:首页 > 科技资讯 > 正文

具身智能:迈向通用智能的耐力赛

深度洞察

  • 大模型的普及几乎不依赖新增物理基础设施,而具身智能则是一个涵盖硬件、算法、环境感知与运维的物理系统。
  • 当前机器人多局限于单一任务,难以跨空间、跨模态完成复杂任务,而具身智能则面临物理世界的挑战。
  • “ChatGPT时刻”对具身智能而言,更多是一个隐喻,而非可复制的路径。大模型证明了算法的威力,而具身智能则考验整个产业系统的耐力。

在人工智能的诸多领域中,具身智能是近年来备受关注的方向之一。

从工业机器人到服务机器人,从自动驾驶到人形机器,各条技术路线都被寄予“通用智能入口”的厚望。

与算法驱动的软件革命不同,具身智能因现实世界的复杂性而面临挑战。

通过公开视频,我们看到的具身智能叙事往往呈现:机器人更加稳定、精准、连贯地执行任务。融资加速,模型迭代,看似正处于上升曲线。

成功被展示,失败被隐藏——在实验室之外,部署成本、稳定性、维护复杂度等问题仍在延长商业化的时间表。

2月10日,原力灵机在北京中关村国家自主创新示范区展示中心举办了首次技术开放日。

原力灵机发布了三款核心产品:具身原生大模型DM0、具身原生开发框架Dexbotic 2.0以及具身原生应用量产工作流DFOL。这是公司核心团队首次集体公开亮相。

在当天的“Physical AI Next”圆桌论坛上,五位嘉宾讨论了具身智能的ChatGPT时刻何时到来。

具身智能:迈向通用智能的耐力赛 具身智能 大模型 算法 产业系统 第1张

“具身智能的ChatGPT时刻”是一个复合概念,涵盖了技术突破、产品体验与商业想象。它既是模型能力的跃迁,也期待像ChatGPT一样被用户快速理解、低成本使用并规模化扩散。

它带着技术乐观主义的兴奋。毕竟,大模型在ChatGPT发布后迅速走向全球用户,完成了一次清晰的跃迁。

人们期待当人工智能拥有身体——能行走、抓取、操作物理世界的实体——是否也会迎来类似的爆发点?

ChatGPT的成功在于其低成本、稳定且可重复验证的使用体验。大模型的普及几乎不依赖新增物理基础设施,对产业而言是一次“轻资产跃迁”。

具身智能则完全不同,它是一个涵盖硬件、算法、环境感知与运维的物理系统。

北京智源人工智能研究院院长王仲远认为,尽管模型能力在提升,但离具身智能的ChatGPT时刻还很远。

“物理世界的不确定性——地面、光照、零部件公差等,都可能导致任务失败。”

这也是为什么,当前具身智能仍停留在“可演示”而非“可大规模复制”的状态。

清华大学电子工程系长聘教授汪玉认为,当前大多数机器人虽有很大进步,但仍局限于单一任务,难以跨空间、跨模态完成复杂任务。

他甚至提出未来住宅设计需要加入“机器人适配”维度。

“与其苛求机器人适应人类环境,不如让建筑和基础设施为机器优化。”

“在工业史上,这种路径并不陌生——流水线、电梯、自动门都是先改变空间再释放自动化价值。”

“具身智能或许也需要类似的‘环境工程’。”

“大模型运行在数字世界,而具身智能要闯入物理世界。前者是规则清晰的棋盘,后者是充满噪声的旷野。”

“如何定义ChatGPT时刻?”阶跃星辰创始人、CEO姜大昕认为零样本是标志。

“零样本去做泛化,即使以前没有见过也可以回答问题。”

“具身智能的‘ChatGPT时刻’会更加困难。”

“单纯技术突破并不等价于产品或产业拐点。”

“当连‘成功’的标准都无法统一,‘时刻’自然沦为模糊修辞。”

“真正贴近商业落地的创业者正在转向更务实的定义。”

“原力灵机CEO唐文斌认为具身智能变得有用、可信赖并在投资回报率(ROI)上算明白时,才是它的ChatGPT时刻。”

“虽然行业火爆但我们整个(具身)智能的能力还在蹒跚学步的阶段。”

“星海图CEO高继扬从产业链角度指出大模型是‘模型即产品’,而具身智能的链条极长从供应链到售后服务等。”

“这意味着具身智能的商业化节奏更兼有制造业的特性:资本回收慢、失败成本高。”

“单一技术的突破很难撬动整个系统的商业化进程。”

“对具身智能而言‘ChatGPT时刻’更像一个隐喻而非可复制的路径。”

“或许在工厂、仓库里它已变成‘离不开但不被讨论’的存在。”

“但在这个终局来临之前它的成熟将像基础设施一样缓慢无声却不可或缺。”

如果说大模型证明了算法的爆发力那么具身智能考验的是整个产业系统的耐力。