当前位置:首页 > 科技资讯 > 正文

VLA:重塑智能驾驶的未来

近期,车市两款备受瞩目的新车——理想i8和小鹏P7,凭借其独特定位和创新技术,在各自领域崭露头角。其中,一个共同提及的核心技术VLA(Vision-Language-Action),正引领着智能辅助驾驶的新潮流。

理想汽车宣布,其辅助驾驶技术已从人工时代迈入AI时代。自2021年至2024年,理想主要依赖规则算法,但从2024年起,将全面进入AI驱动的新纪元。VLA技术让车主能通过语音指令操控车辆,系统更会根据驾驶习惯自我优化,带来近乎人类的驾驶体验。

VLA:重塑智能驾驶的未来 VLA 智能驾驶 视觉-语言-动作模型 认知融合 第1张

小鹏汽车也透露,VLA车端大模型的研发进展迅速,预计将在8月份前全面应用于所有车型,而全新P7无疑将成为搭载这一大模型的“智能司机”,提升行车安全。

01 VLA是什么?

VLA,全称为“视觉-语言-动作模型”,是智能辅助驾驶的核心技术。它将视觉感知、语言理解和动作决策三者融为一体。

视觉感知通过摄像头和激光雷达等设备,识别道路状况、交通标志等。这些数据被送入视觉处理模块,利用深度学习算法解析,转化为计算机能理解的“语言”。

VLA:重塑智能驾驶的未来 VLA 智能驾驶 视觉-语言-动作模型 认知融合 第2张

语言理解则通过大模型训练,理解指令和交通规则。视觉和语言模型通过中间环节融合,构建统一的环境理解。

最终,动作决策生成具体指令,如加速、刹车等,被车辆执行系统精准控制。

02 VLA的应用场景

在复杂道路环境中,VLA能同时处理多种交通参与者。通过摄像头和雷达,“读取”信息后快速分析场景。

例如,遇到行人过马路且信号灯即将变红时,系统会根据实际情况决策。它可能减速停车等待行人,或选择避让快速通过绿灯。

VLA:重塑智能驾驶的未来 VLA 智能驾驶 视觉-语言-动作模型 认知融合 第3张

VLA的拟人化思考逻辑和强大的场景适应性,使其在智能驾驶领域展现出巨大潜力。

结语

VLA的出现标志着智能驾驶从功能叠加迈向认知融合。它尝试在机器中复刻人类的感知方式,将视觉、语言和动作编成一个有机整体。

这不仅提升了效率,更让智能驾驶体验更加“类人化”。虽然目前VLA还存在芯片算力等瓶颈,但随着技术进步,其突破点清晰可见。