智能驾驶领域新词频出,如高阶智驾、无图NOA、端到端、VLA、WEWA架构、NWM等,每隔几个月就有新术语诞生,这映射了技术的快速迭代。
然而,技术更新过快也带来问题:用户一年前购车,可能已无法兼容新技术;甚至用户认知都跟不上新名词。车企内部同样暗流涌动,从规则式到端到端,再到世界模型、物理AI架构,新势力的智驾部门常面临人员更迭、高管离职。
行业普遍认为,今年第四季度到明年上半年是辅助驾驶落地的关键期。随着世界模型、VLA的升级,包括自研车企和Momenta、元戎启行、文远知行等方案供应商,领先地位随时可能变化。
基于规则的辅助驾驶系统,核心模块包括感知、预测、规划、控制,业界称为“模块化方案”,优势是易量产,但缺点明显:四个独立模块串联工作,时延长、信息损耗大。因此,车辆博弈能力受限,在路上进退两难的情况常见。
2023年8月,特斯拉推出端到端FSD V12测试版,“端到端”成为国内智驾热点。华为、小鹏、蔚来和理想陆续跟进,Momenta等供应商也推出端到端方案。
但规则或端到端,本质都是辅助驾驶的模仿学习——将海量人类驾驶数据投喂系统,让系统学会驾驶,衍生出数据采集、标注和清洗等环节,核心是让模型理解数据以提高学习效率和精度。
从根本上说,这种方法与人类学车过程相似,但区别在于系统学习和修正是被动的,而非人类主动学习和修正。
例如,在双左转车道路口左转,人类驾驶员会选车辆少的车道,跟车距离也各异。但基于规则和端到端的系统,通常选最内侧车道。再如,车辆变道进匝道遇堵车,人类可择机汇入,系统则易导致车辆停留。
另一问题是,无主动学习修正能力的系统无法应对所有可能性。用小鹏汽车自动驾驶中心组织负责人刘先明的话说:“即使每天解决99%的极端情况,今天99%,明天99%,也解决不完,除非穷尽所有可能,这要到猴年马月才能实现L4。所以这是无法收敛的难题。”
理想汽车创始人李想解释,端到端对真实物理世界无理解能力,它只接收视觉系统的三维图像,结合车速给出运动轨迹。端到端能应付大部分泛化场景,但若遇到未学过的复杂情况,就会出问题。这也说明,从去年起,量产的端到端都是两段式,而非一段式。
为解决端到端无法收敛的短板,理想汽车加入VLM(视觉语言模型),但因模型开源,在交通场景中能力有限,仅起辅助作用,如识别红灯读秒,结合导航地图输出运动信号。
模仿人类驾驶已被证明无法助辅助驾驶突破到L3,因模仿行为本身有短板,需明确模仿对象且穷尽所有可能性——这像套娃,永远有下一个更小的。
“既然模仿路走不通,就该回到原点。”刘先明说,自动驾驶非简单模仿学习,而应重新理解世界,真正像人类那样驾驶。
李想也表达类似观点:第三阶段即VLA(视觉语言行动模型),用3D视觉和2D组合看真实物理世界,甚至可看懂导航软件,知道其运行方式——相比,VLM只看一张图片。VLA还有大脑系统,能理解看到的物理世界,基于自身语言体系、思维链和推理能力,像人类一样执行驾驶动作。
理想汽车的VLA也称“VLA司机大模型”,原理是将视觉成像转译为语言,再执行动作。小鹏汽车更激进,在11月5日的小鹏2025科技日上,何小鹏宣布小鹏将在新一代VLA模型中直接取消语言转译环节,把摄像头捕捉的多模态物理信号输入,直接输出连续控制信号。
但小鹏的第二代VLA同样有推理过程,只不过隐藏在模型中,非由显性语言模型进行。取消“L“(语言)有两个好处:一是提高模型简洁度和效率,降低信息传递损耗,视频和IMU(空间姿态传感器)信号可不经语言转译直接输出控制信号;二是系统具备大规模“自监督学习”可能,车辆从物理世界采集的视频可直接成训练数据,系统因此有极强泛化能力。
刘先明说:“在海外任何市场,小鹏不再需重新测绘、标注数据,只要小鹏车在跑,就能支撑模型训练,可快速支持部署和落地。”
对于每家公司,自动驾驶第三阶段的路线不尽相同。理想汽车自动驾驶研发高级副总裁郎咸朋认为,华为是规则时代强者,用规则打不败华为,端到端本是新技术路线,但今天它已从新市场变旧市场。“如果理想要做真正自动驾驶就不能继续在这战场打,要换战场,那就是VLA。”
今年3月,理想汽车已发布VLA技术方案。此后关于VLA是否可行的讨论渐起,华为智能汽车解决方案BU CEO靳玉志认为,华为不会走VLA技术路线,因VLA将视频转化为语言token再控制车辆的做法是“取巧的”,华为的WAWE架构和小鹏第二代VLA类似,也省略语言环节,通过视觉、声音、触觉等多模态信息直接控制车辆。
博世智能驾驶与控制系统事业部中国区总裁吴永桥则提到VLA落地的四个难点:多模态特征对齐困难;多模态训练数据提取困难;大语言模型存在无法避免的“幻觉”;当前智驾芯片存储带宽非为大模型专属设计,无法支持大量数据传输和计算。
与华为同样选世界模型路线的是蔚来。蔚来自动驾驶研发首席专家、副总裁任少卿也持类似观点,他认为VLA把语言和动作捆绑,仍以语言为中心。语言模型带宽不足以应对现实世界的复杂性和连续性。
用刘先明的说法,VLA模型中的多模态特征对齐可能存在信息丢失。小鹏汽车展示的一个近6秒视频片段中,包含大量视觉信息、道路状况和车辆运动信息,若用VLA模型,意味这些信息要先转化为语言文本,对齐是确保转化准确度最优的过程。“但实际上,就算用上千字描述,也会比直接视频呈现存在信息损失,这就是所见非所得。我们认为,去掉语言环节是最简单、简洁的方式。”刘先明说。
但不论哪条路线,背后都指向“大算力、大数据和大模型”。在小鹏计划面向Ultra版车主交付的第二代VLA中,支持算力高达2250TOPS,由三颗自研图灵AI芯片提供。蔚来同样自研芯片——在蔚来的世界模型里,任少卿力推加入强化学习模型,他认为这是把短时记忆模仿学习升级为可处理长时序智能体的关键。
加入蔚来前,任少卿与曹旭东在2016年创办自动驾驶公司Momenta。当他在2020年——蔚来低谷期加入蔚来领导自动驾驶开发,曾引发轰动。他认可大规模高质量数据对AI技术变革的推动作用,这也是他从Momenta离开加入蔚来的核心原因。
自动驾驶技术路线切换,实际上从2023年底就已开始。2024年11月,小鹏把原本在10月24日举办的科技日改到11月7日。科技日前,小鹏P7+上市,当时刚晋升副总裁、担任自动驾驶中心负责人的李力耘是端到端技术发布主讲。
但当时小鹏已在内部同时推进两条研发路线——传统VLA和创新VLA,建成3万卡规模智算集群。所谓创新VLA就是目前第二代VLA雏形,去掉L环节。但一直看不到希望,“当时团队几个负责人连月会、周会都不好意思来开了”,何小鹏一度想放弃,先聚焦传统VLA。
创新VLA的曙光出现在第二季度。何小鹏接到自动驾驶团队电话,应要求亲自测试当时VLA版本,结果体验超预料。随后他果断放弃传统VLA,全力开发第二代VLA。
创新VLA项目负责人是刘先明。他于2024年3月加入小鹏汽车,此前曾在Meta和通用汽车旗下Cruise从事机器学习与计算机视觉研究。何小鹏非常信任他,两人交流频率高,且多次交流持续几小时。
2025年10月,国庆假期刚过,小鹏汽车内部宣布刘先明接替李力耘担任自动驾驶中心组织负责人。刘先明和李力耘是智驾领域不同技术路线代表,后者偏向智驾产品,重在功能实现和产品落地,李力耘助小鹏实现NGP落地至数百城市,刘先明则重在打造能推演物理世界的世界基座模型,助小鹏自动驾驶技术具更强泛化能力,走向全球。这一调整意味小鹏汽车自动驾驶技术路线彻底从功能实现到基础模型转型。
更早前,吉利、蔚来和理想汽车的智驾组织已大幅调整。吉利将内部多个智驾研发团队整合到千里科技,同时还引入外部合作伙伴作核心供应商。
今年9月19日,理想汽车将自动驾驶研发部门重组为11个二级部门,调整重点是将研发资源向VLA倾斜,原本模型算法团队被拆分成基础模型部、VLA模型部和模型工程部。11个部门负责人均直接向郎咸朋汇报。“此次调整是为推动团队向AI组织演进。”理想汽车在内部信提到。同时,他们还取消了过去采用的大规模封闭研发模式。
蔚来的调整和小鹏几乎同时。蔚来世界模型负责人马宁宁、蔚来智驾产品负责人黄鑫、蔚来智驾项目管理部负责人郑可、蔚来智驾端侧部署AI引擎部负责人吴钊等自动驾驶团队负责人相继离职。蔚来解释:“主动调整的组织架构,将更有利于蔚来全力冲刺世界模型2.0版本的开发与交付。”这已是蔚来一年内关于自动驾驶部门的第三次组织架构调整。
每一次技术路线切换,都意味公司投入资源倾斜和对应人事调整。规则时代的模块化开发并不适用于端到端,因此,从规则式切换到端到端,小鹏、理想、蔚来的自动驾驶部门已发生多轮组织架构调整。
2024年8月,小鹏就因为切换到端到端路线,把原本承担算法研发,覆盖了感知、规划、控制和定位的技术开发部拆成三个全新部门,分别是AI端到端、AI能效和AI应用。
随着端到端成旧时代产物,汽车公司也迅速调整组织以迎合新技术路线开发需求。以理想汽车为例,他们曾将夏中谱负责的端到端从算法研发部门独立出来,两者成平行部门。但不久后,理想就将VLA确定为下一代技术路线,由算法研发部门负责人贾鹏主导研发,人员和研发资源向算法研发部门倾斜,这被认为夏中谱最终离职的原因之一。
在造车新势力带动下,自动驾驶技术自研曾被认为是汽车公司标配。比如奇瑞汽车,后来成立的大卓智能,就是前特斯拉、小鹏汽车自动驾驶专家谷俊丽领导的专门进行自动驾驶技术研发的公司。
在自研浪潮中,长城以内部孵化和投资方式成立毫末智行;吉利的新能源高端品牌极氪也选自研路线。上汽、广汽和长安也纷纷把钱投向自研。但从去年开始,这些汽车公司开始选择优质自动驾驶公司成为核心供应商。
长城汽车把魏牌蓝山的NOA交给元戎启行,还参与后者最新一轮融资,形成鲜明对比的是,毫末智行陷入困难,管理层先后离开;奇瑞汽车先后和卓驭科技(前身是大疆孵化的车载事业部)、文远知行达成合作,大卓智能始终上不了台面;广汽重新和华为合作;上汽在和Momenta合作后,又和华为成立全新尚界品牌。
自研和供应商方案的竞争,在今年愈演愈烈。长期关注智能驾驶的电动知士资深媒体人大雨认为,今年第四季度,供应商方案会成为闪光点,他们的进展非常快,竞争会从自研的汽车公司主导转向供应商主导。
今年8月,文远知行正式推出与博世合作的一段式端到端辅助驾驶解决方案WePilot AiDrive,这距离他们的两段式端到端方案量产上车仅过去半年时间。两位曾经参加过该方案的体验者给予了很高评价,认为文远知行足以依靠这套方案跻身第一梯队,消解小鹏汽车这些汽车公司原本建立的领先优势。这套方案将首先应用在奇瑞汽车星途的ES、ET系列车型上。
文远知行的一段式端到端方案具备可伸缩的算力适配能力、多传感器构型适配能力,意味兼容能力更强,可适配车型更多。当然,这也是Momenta、元戎启行这些解决方案供应商的天生优势。
一位在造车新势力负责智驾测试的工程师说,车企的平台化设计、成本考量就决定了自研很难拥有供应商的自由度、兼容性和快速迭代能力,的确,车企的核心优势在数据,但随着合作伙伴增加,供应商能够把数据的劣势缩小。
他这样比喻自研和供应商的区别:“自研更像是定食套餐,根据餐厅定位设计开发,给什么就吃什么;供应商就像是自选餐厅,要吃什么自己选,丰俭由人。”这个比喻并不全面,但极具代表性。
资金的效率成为自研的另外一个掣肘。正如何小鹏在2025科技日上感慨,从2024年至今,小鹏汽车建成3万卡规模智算集群,光训练费用投入就高达20亿元,正因如此,何小鹏一度考虑先放弃创新VLA路线。理想汽车同样如此,为支持研发,理想汽车在云端搭建了13 EFLOPS算力。但对小鹏汽车、蔚来而言,今年第四季度盈利又显得尤为迫切。
不管是规则式,端到端还是现在的新势力、华为主导的VLA、世界模型等路线,在产品落地层面,仍属于L2框架。但现在VLA和世界模型被认为是通向L4的积极因素。小鹏汽车甚至认为,第二代VLA可为具身智能落地铺路。
何小鹏曾说过,没有智能化,电动汽车毫无意义。从2020年到现在,智能驾驶真正的竞争才刚刚开始。
本文由主机测评网于2026-01-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260120574.html