当前位置:首页 > 科技资讯 > 正文

苹果与微软技术大牛联手:Lyte获亿元融资,4D端到端感知系统助力物理AI突破

在过去的一年里,“物理AI”已然跃升为人工智能领域的下一个战略高地,并迅速凝聚成行业共识。此前,业界普遍认为“物理AI”的短板在于具身智能数据的匮乏以及世界模型的不成熟。然而,即便是在被视为相对成熟的“感知”层面,现状也远未达到支撑复杂物理交互的要求。

长期以来,感知能力往往被拆解为孤立的零部件问题,而非系统性的工程挑战。许多硬件团队不得不耗费数年时间,从零开始搭建感知技术栈:从繁杂的供应商名单中筛选传感器、校准系统、反复调试同步误差。这种“重复造轮子”的过程极大拖慢了创新效率。

事实上,系统化的感知能力在消费电子领域早已被攻克并实现大规模商用,最具代表性的便是微软的Kinect和苹果的FaceID。如今,这两项划时代技术的幕后推手走到了一起,共同创立了科技初创公司——Lyte。

Lyte的目标是将先进的4D传感、RGB成像和运动感知能力整合至单一平台,仅需一个接口即可提供高度统一的空间与视觉数据。这种设计理念让机器的“眼睛”能够直接与“大脑”对话,旨在构建物理AI行业急需的底层感知基础设施。

据悉,Lyte近日已成功完成1.07亿美元的早期融资,投资方阵容豪华,包括Avigdor Willenz、Fidelity、Atreides Management、Exor Ventures、Key1 Capital和Venture Tech Alliance等知名机构。

Kinect与FaceID缔造者集结,定义AI端到端感知新范式

Lyte由苹果深度传感与感知技术的首席架构师Alexander Shpunt(CEO)、Arman Hajati及Yuval Gerson联合创立。

苹果与微软技术大牛联手:Lyte获亿元融资,4D端到端感知系统助力物理AI突破 物理AI  具身智能 LyteVision 4D感知技术 第1张

Lyte创始核心团队

CEO Alexander Shpunt曾是3D传感先驱公司PrimeSense的联合创始人兼CTO。自2005年起,他便深耕于“如何教会机器感知深度”这一课题。他致力于让机器像人类一样洞察空间——捕捉的不再是平面像素,而是物体的多维属性、精确距离以及三维空间中的复杂关联。

为此,他和团队研发了“光编码技术”:通过红外投影仪将隐形点阵覆盖整个场景,再由摄像头捕捉点阵扭曲并利用三角定位法实时生成深度图。2010年,该技术成功商业化,诞生了在60天内狂销800万台的微软Kinect。

2013年,PrimeSense被苹果收购,Shpunt团队随之加入苹果并持续迭代技术。2017年,FaceID随iPhone X问世,这项技术如今已服务于全球数十亿台设备。

早在2021年,Alexander Shpunt便敏锐洞察到“物理AI”的萌芽。AI不再局限于文本处理和图像识别,而是开始进入仓库导航、机械作业、自动驾驶等实体场景。AI正从云端走向现实世界。

然而,挑战也随之升级。在手机上,感知的小瑕疵或许只是体验不佳;但在仓库或公路上,感知层的一丝误差都可能导致灾难性后果。Shpunt坚信,“物理AI”落地的关键在于对物理世界极其可靠的理解,机器人必须学会在动态且复杂的非受控环境中安全生存。

于是,他集结了苹果时期的核心班底再次创业。CTO Arman Hajati曾主导多代iPhone和Apple Watch的触觉引擎架构;工程副总裁Yuval Gerson精通微机电系统(MEMS);硬件负责人Reza Nasiri Mahalati则在多模态传感模块的软硬件一体化集成方面拥有深厚造诣。

从3D到4D:引入“瞬时速度”解决感知延迟

据预测,到2030年,AI机器人市场规模将突破1250亿美元。但麦肯锡调研显示,逾60%的工业企业因缺乏传感器集成等核心能力,难以独立实现自动化转型。

Lyte采取垂直整合策略,将传感硬件、定制芯片和感知软件封装进统一平台,为具身智能机器人提供清晰、稳健的感知层,彻底解决传统方案中传感器堆叠导致的系统冗余问题。

传统的结构光技术虽在室内和人脸识别中表现卓越,却有其天生局限:有效距离短,且只能捕捉“位置”而无法捕捉“趋势”。

对于移动中的机器,这显然不够。一台在繁忙仓库穿梭的叉车,不仅要被“看见”,它的行驶速度和方向也必须被实时获知。传统传感器依赖软件算法对比前后帧来推算运动,这种计算滞后在动态环境下极具风险。

Lyte团队在Kinect和FaceID的开发经验基础上,为感知引入了关键的第四维度——速度。他们研发的“相干视觉”技术不再是简单的图案投射,而是发射连续信号并测量回波。这种物理层的革新,使得位置与速度能在同一瞬间被直接捕捉,无需后续繁琐计算。

简单来说,过去的速度感知靠算法补齐(有延迟),而Lyte的方案靠物理直取(零延迟)。

LyteVision:实现机器视觉与决策的高效协同

依托“相干视觉”核心技术,团队打造了LyteGalaxy空间智能平台。这不仅是一个传感器集合,更是一个深度融合了计算单元、软件算法的完整感知技术栈。

苹果与微软技术大牛联手:Lyte获亿元融资,4D端到端感知系统助力物理AI突破 物理AI  具身智能 LyteVision 4D感知技术 第2张

LyteVision感知系统展示

其旗舰硬件LyteVision在2026年CES展会上荣获机器人技术“最佳创新奖”。该系统将4D传感、RGB成像和惯性测量单元(IMU)集成在单一模块中,通过单一连接实现视觉与空间数据的同步输出。

LyteVision的优势在于其“三步走”的集成逻辑:

1. **原始感知**:集成4D相干视觉、可见光与IMU,实现模块化的即插即用。

2. **融合处理**:通过定制芯片在硬件层完成多传感器融合,提供毫秒级同步的纯净数据,让开发者省去调试同步的麻烦。

3. **深度理解**:通过打通传感器到云端的完整路径,配合AI模型处理,确保机器在瞬间做出决策并执行指令。这种端到端的闭环,让“眼睛”与“大脑”真正实现无缝衔接。

由于其高度的通用性,LyteVision能够广泛赋能各种形态的AI平台,从人形机器人、四足机器人到自动驾驶出租车(Robotaxi),为不同设备提供统一的世界观。

物理AI正值破晓,感知层变革蕴含巨量机遇

随着物理AI的崛起,AI对感知的需求正从静态识别向动态交互、实时理解跨越。以往AI只需“认出”脸,现在它必须在复杂的真实环境中“生存”。

Lyte团队通过软硬件垂直整合,将感知系统的复杂性内化,输出给用户的是极简且高效的产品。这种“端到端”的思路与特斯拉的纯视觉方案殊途同归——即通过高度集成化和数据闭环来驱动能力进化。

目前,“物理AI”仍处于爆发前期。除了我们此前讨论的操作系统、数据短板和模型缺陷外,感知层的革新同样是关键的一环。Lyte的出现证明,感知技术远未触及天花板,在智能、感知与运动控制的每一个维度,都潜藏着颠覆性的创业机会。