当前位置:首页 > 科技资讯 > 正文

阿里AI进军物理世界:具身智能下的变革与挑战

阿里AI进军物理世界:具身智能下的变革与挑战 具身智能 阿里 AI 物理世界 第1张

在科技与资本的交汇点,一场新的风暴正在酝酿,而这次风暴的中心聚焦于连接AI与物理世界的桥梁——具身智能。在这场变革中,科技巨头阿里正积极搅动市场。

近期,阿里通义千问的技术领军人物林俊旸宣布,其团队内部已成立专注于具身智能的研究小组,标志着阿里正式进军物理AI领域。事实上,仅一个月前,阿里云还领投了国内机器人创业公司自变量机器人的1.4亿美元融资。

从投资到亲自下场,阿里的野心昭然若揭,它正全力以赴为AI寻找一个能够感知和改造物理世界的“身体”。这背后反映了一个深刻的时代背景:我们正处在一个奇特的AI“断层”时代。

一方面,以通义千问、GPT-4为代表的大语言模型正在以前所未有的速度进化,展现出惊人的认知与生成能力。但另一方面,AI的“身体”却显得笨拙。在物理世界中,除了特定场景下的工业机械臂,几乎看不到能够自主理解环境、与人协同的智能物理实体。

这一断层也孕育着巨大机遇。去年,吴泳铭就直言,AI最大的潜力在于接入现实世界。在今年6月的年度股东大会上,黄仁勋强调,AI和机器人技术是最大的两个增长机会,代表着数万亿美元级别的增长潜力。

眼下,OpenAI、Google、软银、英伟达等巨头纷纷在具身智能领域布局。一场为AI“寻找身体”的战争已经打响。对于正处在转型与价值重估关口的阿里而言,这也是其实现ASI宏伟理想、“再伟大”的关键一步。

1

从云端到现实

10月8日,林俊旸发布了一条重磅消息:团队已正式建立“机器人和具身智能小组”。

林俊旸在推特中指出,多模态基础模型正转变为基础Agents,这些Agents可以利用工具和记忆,通过强化学习进行长视野推理,“它们绝对应该从虚拟世界走向物理世界”。

这意味着阿里决心让通义千问从语言世界跨入物理世界。就在不久前的云栖大会上,阿里巴巴集团CEO吴泳铭断言,行业正进入AI的“自主行动”阶段。吴泳铭表示,未来或将有超过全球人口的智能体和机器人与我们共同工作生活。

对阿里而言,将AI从云端推向实体世界正是其通往超级人工智能(ASI)宏大蓝图中至关重要的一步。事实上,阿里已经为进军具身智能布局已久。

自2024年以来,阿里集团陆续投资了逐际动力、星动纪元、宇树科技、星海图、灵心巧手等一批具身智能公司。阿里云则在今年9月领投了自变量机器人的1.4亿美元融资。

有知情人士透露,去年上半年,阿里开始重点关注具身智能,“投了几乎所有具身智能公司”。因为机器人是大模型能力从数字世界走入物理世界最理想的载体。阿里通过投资宇树、逐际动力、自变量机器人等不同技术路线的公司,抢占赛道。

显然,阿里对具身智能的布局并非一时兴起。要理解其动机,必须将其置于阿里当前的内外部环境以及对未来科技终局的判断之中。

首先,这是战略的必然性:AI的终点必然是物理世界。当大语言模型的能力趋于完善,其价值的进一步释放必然要求它能够感知、理解并改造物理世界。一个只能在对话框里运行的AI,其商业天花板是可见的;但一个能够通过机器人实体与环境互动的AI,潜力则是无限的。

将阿里的动作放在全球AI版图上看,并不孤单。

就在同一周,软银集团宣布以54亿美元收购ABB的工业机器人业务;英伟达CEO黄仁勋也再次提到,AI与机器人是“数万亿美元级别的长期增长机会”。马斯克将其人形机器人“擎天柱”视为特斯拉未来价值的核心,首先要颠覆自家工厂的生产模式。

全球巨头纷纷下场,物理AI成了下一个战场。对阿里而言,其商业帝国的根基——电商、物流、新零售都与物理世界紧密相联。无论是菜鸟网络遍布全球的智慧仓储,还是盒马鲜生的自动化供应链,都存在大量需要与物理实体交互的场景。

可以说,这些场景是具身智能最直接、最广阔的应用试验场。因此,将AI能力“实体化”是对其核心业务升级的内生需求。

2

填补行业鸿沟

“现在AI写文作画已经比99.99%的人都要做得好。但真正让AI干活还是一片荒漠。”在一个月前的外滩大会,宇树科技创始人王兴兴在圆桌论坛发言时如是说道。

可以说,当下正处在一个技术“断层”地带。一边是AI“大脑”大模型的智慧正在以指数级速度爆发;另一边是AI“身体”的笨拙与物理世界的复杂性形成了鲜明对比。这道鸿沟限制了AI的潜力。

行业内的共识是:让AI拥有身体进入物理世界“干活”,是一片巨大的蓝海。

摩根士丹利预测,到2050年,全球人形机器人将累计部署10亿台,市场规模达5万亿美元。这一数字大约是2024年全球20家最大汽车制造商总收入的两倍。据中金估算,中国人形机器人潜在市场空间有望于2050年达22.8万亿元。

如此确定性将全球具身智能市场推向了爆发的前夜。各路玩家和资本都争先恐后极力把握这股历史性的机遇。优必选、宇树科技、银河通用、智元机器人等企业都宣布今年预计量产千台人形机器人。

在燥热的氛围下今年机构们的热钱也争相涌进具身智能赛道。有行业投资人士表示今年以来具身智能领域频频出现单笔超5亿元人民币级别的融资包括宇树、银河通用、千寻智能、星动纪元、逐级动力等。

一个爆发的新趋势已经逐渐浮现。不过掘金的过程并非一蹴而就如何让大模型完全融入具身智能是眼下横亘在AI落地物理世界的关键卡点。

而阿里要做填补这一鸿沟的“卖铲人”。

此前王兴兴曾多次表示与硬件相比具身智能更大的挑战是大模型方面的短板“最大的问题是具身智能AI不够用”。

过去很多大模型在虚拟场景里表现亮眼一到物理世界就水土不服。因为传统大模型依赖海量互联网文本数据训练而具身智能需物理世界交互数据数据更少量且获得难度更高。

3

重估阿里:全栈AI闭环

由此阿里的野心也渐渐清晰:由通义千问担当通用的“大脑”负责任务理解与规划;由阿里投资的硬件公司担当专用的“执行单元”负责动作落地。

在这场关乎未来的全球牌局中每一位玩家都手握不同的牌。事实上阿里已经组合培育好一套独特的底牌——套覆盖了从算力、云、模型到应用场景的“全栈AI”闭环。这不仅是其参与竞争的资本更是其重塑价值重述“伟大”叙事的核心。

回看市场我们可以看到两种截然不同的巨头成长路径。以软银集团为例其创始人孙正义是一位卓越的“猎手”通过外部收购和投资快速拼凑起一个覆盖全球的“信息革命”生态。

相比之下阿里巴巴的路径更像是一种“耕种”依托自身庞大的业务生态从内部培育技术生长的土壤。这种模式的优势在于技术与场景之间存在着天然的联系在具身智能时代这种联系构建了一个独一无二的飞轮效应。