当前位置:首页 > 科技资讯 > 正文

它石智航:具身智能领域的“梦之队”崛起

文|王欣

编辑|苏建勋

在2025年火热的具身智能创业浪潮中,“它石智航”凭借强大的实力,吸引了无数目光。

这是一个由国内智驾黄埔军校核心高管组成的“梦之队”。它石智航首席执行官陈亦伦,曾在华为车BU担任自动驾驶系统CTO;首席科学家丁文超,曾是华为“天才少年”。董事长李震宇,则担任过百度智能驾驶事业群原总裁,打造过全球最大的Robotaxi出行平台“萝卜快跑”。

在自动驾驶领域,陈亦伦、李震宇均带领团队取得了卓越成就。他们的合作创业,让“它石智航”迅速成为资本的宠儿。今年3月,它以1.2亿美元的融资额,创下了中国具身智能行业天使轮最大融资额纪录。

资本之所以青睐“它石智航”,是因为它的技术积累和人才储备。线性资本创始人兼CEO王淮曾这样评价:“他们能将之前在华为做自动驾驶的经验,结合大模型的思考和推理能力,应用于具身机器人。”

尽管天使轮融资破纪录,创始团队豪华,但不同于其他具身智能公司频繁披露出货量与技术突破,“它石智航”在2025年鲜少公布进展。

它石智航:具身智能领域的“梦之队”崛起 具身智能 它石智航 世界模型 TARS AWE 第1张

图源:它石智航

12月19日,“它石智航”举办了一场线上发布会,仅持续40分钟,展示的成果是“全球首个完成刺绣的机器人”。

为什么要选这个场景?“这是我们目前技术能力的外溢。”它石智航CEO陈亦伦告诉《智能涌现》,他口中的技术能力,指长程(包括多个环节任务)、精细复杂(类似刺绣)的动作问题,且操作对象是柔性的、不易建模的物体。

目前具身行业常用抓取、叠衣服、倒咖啡展示技术能力。据“它石智航”官方透露,此前没有企业公开展示过机器人刺绣这一能力。这是因为对机器人而言,处理柔性物体的难度要远大于刚性物品。

通用的VLA难以处理这一难题。VLA本质是视觉引导的任务,因此在力或触觉等感受维度存在瓶颈。因此,行业在视觉上的探索逐渐收敛,但如何处理力或触觉,行业尚未达成共识,也没有统一的数据采集方法。

而世界模型能解决这个问题。“它石智航”构建了具身基础模型——TARS AWE (AI World Engine) 2.0。将现实采集到的数据,用一段式全身端到端学习,迁移到机器人本体。

处理柔性物体的难点在于——不仅要知道自己怎么动,还要知道动了之后环境世界会怎么演化。而世界模型能破解这一核心矛盾,预测两个关键因素:一是看到场景后采取什么行动,二是建立模型模拟行动后世界如何变化。

世界模型的核心挑战在于数据和空间感知力。

如何应对这一挑战?它石智航CEO陈亦伦和首席科学家丁文超,回顾了智驾时期的技术思考。他们发现具身行业的许多问题,都能在智驾发展历程中找到答案。

此前在蓝驰创投的2025人民币基金合伙人年会上,陈亦伦谈到2022年离开华为自动驾驶团队时交付的最后一个产品特性是端到端系统。在城中村部署后,工程师们被其灵活智能的穿行效果惊呆了。一个黑盒神经网络仅靠端到端就实现惊人效果,他意识到:算法替代复杂工程栈的时代已到来。

他逐渐发现智驾和具身的overlap:“自动驾驶和机器人技术同宗同源。自动驾驶技术栈早期来自机器人团队。当端到端在自驾中展现巨大威力时,我深信机器人技术也必然存在一套对等的全AI化算法全栈。”

“具身的现阶段相当于智驾的2019年。”陈亦伦对《智能涌现》谈到:“当问题像雪花般飘来时,我们开始认真思索如何将智驾做到规模化,使解决问题的能力比发现问题的能力更高。”

与目前的具身行业相同,那时面临的瓶颈是缺乏数据。陈亦伦观察到,要突破智驾的数据关,需要10万小时精选高质量数据片段。具身智能因任务复杂度高,需要至少100万小时真实场景数据。

这确立了“它石智航”的技术主线:自研具身数据采集系统SenseHub(包括手套和全景相机),采集真实人类场景下动作、语言、触觉等环境语义数据集。基于这些真实数据,构建具身基础模型TARS AWE 2.0。

它石智航:具身智能领域的“梦之队”崛起 具身智能 它石智航 世界模型 TARS AWE 第2张

图源:它石智航

在陈亦伦和丁文超看来,这是探索具身智能 Scaling Law可行性的最短路径。

他们也看到这一能力的前景:“只有把柔性物体操作做好,才能真正实现柔性产线级生产力。”