文|富充
编辑|苏建勋
在2025年世界人工智能大会(WAIC)期间,上海期智研究院举办的“人工智能交叉科学论坛”成为了焦点,汇聚了国内具身智能领域的顶尖学者。
这场论坛汇聚了“伯克利四子”——吴翼、高阳、许华哲和陈建宇,四位学者均毕业于加州大学伯克利分校,并致力于具身机器人研究。
陈建宇创建了星动纪元,高阳是千寻智能的联合创始人,许华哲是星海图的联合创始人,而吴翼则担任蚂蚁集团强化学习实验室的首席科学家。
这四位专家罕见同台,分享了具身智能领域的核心议题。
具身智能的瓶颈——如何高效“获取数据”?
从简单任务到复杂任务,机器人如何提升从大脑到本体的能力?
“VLA算法”已形成共识,但还有哪些非共识的方法论值得探索?
除了企业家和大厂科学家的身份外,这四位学者还担任上海期智研究院的首席研究员。
上海期智研究院由姚期智创立,他不仅是图灵奖得主,还是清华大学交叉信息研究院的院长。研究院致力于培养世界顶尖的计算机科学人才。
以下是根据陈建宇、高阳、吴翼、许华哲在“人工智能交叉科学论坛”上的发言,由《智能涌现》总结整理:
陈建宇畅想了与机器人相关的未来世界,并认为实现这一愿景需要经历三个阶段。
第一阶段,机器人将融入生产力系统,生产手机、汽车等日常用品,其贡献可能超过当前GDP的一半。
第二阶段,机器人将成为最大的终端,并实现自我制造。
第三阶段,机器人将帮助人类拓展能力边界,如火星移民。长远来看,机器人甚至能遍布整个宇宙。
陈建宇认为,实现这些目标的最短路径是向人类学习。因为人类是目前唯一的通用智能体。
他提出了“具身智能数据金字塔”模型,展示了具身智能训练数据的来源。
金字塔的顶端是遥操作采集的数据,但仅使用这种方法无法达到具身智能所需的数据量。因此,必须利用人类行为的数据。
高阳提出了“数据金字塔”的概念,认为要利用不同质量、不同来源的数据来扩大数据量。
他强调了触觉在具身智能中的重要性,并提出了“TactileVLA”概念,即在VLA基础上加入触觉。
此外,高阳还提出了“OneTwoVLA”模型,将快速直觉思考与系统思考相结合,以提高机器人的任务执行效果。
吴翼认为,具身智能体的未来将是多智能体(Multi-Agent)的交互。
他提出了具身智能体需要具备规划、记忆调整和使用工具的能力。
通过软件智能体与硬件的交互,具身智能体可以像大模型一样进化。
许华哲指出,虽然大量数据对于具身智能很重要,但数据的质量同样关键。
他提出了具身智能数据Scaling的坐标系统,包括World Sampling和Path Sampling。
他认为,通过单边提升这两个坐标中的任何一个都可以促进Scaling的形成。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260438848.html