当前位置:首页 > 科技资讯 > 正文

具身智能论坛:顶尖学者共探AI未来

文|富充

编辑|苏建勋

在2025年世界人工智能大会(WAIC)期间,上海期智研究院举办的“人工智能交叉科学论坛”成为了焦点,汇聚了国内具身智能领域的顶尖学者。

这场论坛汇聚了“伯克利四子”——吴翼、高阳、许华哲和陈建宇,四位学者均毕业于加州大学伯克利分校,并致力于具身机器人研究。

陈建宇创建了星动纪元,高阳是千寻智能的联合创始人,许华哲是星海图的联合创始人,而吴翼则担任蚂蚁集团强化学习实验室的首席科学家。

这四位专家罕见同台,分享了具身智能领域的核心议题。

具身智能的瓶颈——如何高效“获取数据”?

从简单任务到复杂任务,机器人如何提升从大脑到本体的能力?

“VLA算法”已形成共识,但还有哪些非共识的方法论值得探索?

除了企业家和大厂科学家的身份外,这四位学者还担任上海期智研究院的首席研究员。

上海期智研究院由姚期智创立,他不仅是图灵奖得主,还是清华大学交叉信息研究院的院长。研究院致力于培养世界顶尖的计算机科学人才。

具身智能论坛:顶尖学者共探AI未来 具身智能 瓶颈 数据获取 多模态 第1张

以下是根据陈建宇、高阳、吴翼、许华哲在“人工智能交叉科学论坛”上的发言,由《智能涌现》总结整理:

陈建宇:向人类学习,获取最佳数据

陈建宇畅想了与机器人相关的未来世界,并认为实现这一愿景需要经历三个阶段。

第一阶段,机器人将融入生产力系统,生产手机、汽车等日常用品,其贡献可能超过当前GDP的一半。

第二阶段,机器人将成为最大的终端,并实现自我制造。

第三阶段,机器人将帮助人类拓展能力边界,如火星移民。长远来看,机器人甚至能遍布整个宇宙。

陈建宇认为,实现这些目标的最短路径是向人类学习。因为人类是目前唯一的通用智能体。

他提出了“具身智能数据金字塔”模型,展示了具身智能训练数据的来源。

金字塔的顶端是遥操作采集的数据,但仅使用这种方法无法达到具身智能所需的数据量。因此,必须利用人类行为的数据。

具身智能论坛:顶尖学者共探AI未来 具身智能 瓶颈 数据获取 多模态 第2张

高阳:融合“快与慢”,提升机器人思考

高阳提出了“数据金字塔”的概念,认为要利用不同质量、不同来源的数据来扩大数据量。

他强调了触觉在具身智能中的重要性,并提出了“TactileVLA”概念,即在VLA基础上加入触觉。

此外,高阳还提出了“OneTwoVLA”模型,将快速直觉思考与系统思考相结合,以提高机器人的任务执行效果。

吴翼:具身智能体将是未来的Multi-Agent

吴翼认为,具身智能体的未来将是多智能体(Multi-Agent)的交互。

他提出了具身智能体需要具备规划、记忆调整和使用工具的能力。

通过软件智能体与硬件的交互,具身智能体可以像大模型一样进化。

许华哲:数据质量比数量更重要

许华哲指出,虽然大量数据对于具身智能很重要,但数据的质量同样关键。

他提出了具身智能数据Scaling的坐标系统,包括World Sampling和Path Sampling。

他认为,通过单边提升这两个坐标中的任何一个都可以促进Scaling的形成。