当前位置:首页 > 科技资讯 > 正文

特斯拉AI5:创新车载计算平台的终极挑战

AI5并非仅是一枚芯片

尽管马斯克在公开场合称之为“AI5 Chip”,但在特斯拉内部,它实际上是HW 5.0——第五代车载计算平台。

2024年6月,马斯克在X活动中宣布HW 5.0更名为AI5,并沿用至今。时间推进到2025年11月的股东大会上,马斯克表示:“在AI5之后,将不再推出下一代车载芯片。

无人驾驶、人形机器人、数据中心,全依赖这一平台。他的原话是“Solving AI5 was existential to Tesla”——这对特斯拉至关重要。

换言之:若无法搞定,特斯拉便岌岌可危。

01

一款巨兽

特斯拉AI5:创新车载计算平台的终极挑战 AI5 特斯拉 车载芯片 计算平台 第1张

2025年6月,一份疑似来自三星供应链的文档在韩国科技社区曝光,列出了AI5的核心参数:

特斯拉AI5:创新车载计算平台的终极挑战 AI5 特斯拉 车载芯片 计算平台 第2张

若这些数字属实,AI5的性能将逼近英伟达H100。H100售价3万美元,功耗700瓦,专为数据中心设计。车载芯片能达到这一水平?有些不可思议。

特斯拉官方未予回应。马斯克自己在播客里透露:“This is a beast. 这是一款巨兽。”

在Q3财报会上,他给出了更多细节:

推理性能是HW4的40倍;

内存容量是HW4的9倍;

能效提升3倍;

每美元性能可能是英伟达的10倍。

2026年1月,马斯克在X活动上直接与英伟达对标:

“单芯片大致为Hopper级别,双芯片为Blackwell级别,但成本极低,功耗也低得多。”

Hopper推理算力约4000 TOPS,功耗700瓦,而Blackwell算力翻倍至9000 TOPS,功耗破千瓦。

泄露的数字逐渐被证实。马斯克虽常吹牛,但这次似乎靠谱。

算力涨了8倍,推理性能却涨了40倍——中间的5倍差距来自何处?答案是架构优化

马斯克举了一个例子:神经网络中的SoftMax操作用于计算概率分布。在HW4上需运行40个步骤模拟;AI5硬件原生支持,几步即搞定。一个操作省去三十几步,乘以网络里几百万次调用,5倍的差距源于此。

更激进的是做减法。AI5直接砍掉了GPU和图像处理器(ISP)。

先说ISP。摄像头传感器输出12-bit原始数据,4096级亮度。特斯拉以前的做法是先由ISP处理成“美观图像”再喂给神经网络——去噪、调色、压缩,信息会有损失。

现在FSD绕过ISP,从原始光子数据输入直接输出控制信号,信息更多,延迟更低。马斯克的原话是“我们不在乎图片是否美观,我们只要数据。”

再说GPU。智驾芯片里的GPU通常做两件事:跑神经网络,渲染屏幕上的车道线和周围车辆。特斯拉把渲染工作交给了座舱的AMD Ryzen,FSD芯片只干一件事:跑端到端神经网络。GPU成了多余面积,砍掉。

砍完后,芯片面积缩减到光刻机单次曝光的一半——马斯克称之为“半个光罩”。面积小,成本就低,良率就高,发热就少。省下的晶体管预算?全投推理单元。

内存也在升级。HW3用LPDDR4,手机同款,带宽70 GB/s。HW4首次用显卡内存GDDR6,带宽拉到384 GB/s。

泄露显示AI5带宽达到1.9 TB/s。如果属实,大概率用的是HBM3——H100同款的高带宽内存,把好几层DRAM堆叠焊在芯片上。车载平台用HBM,行业首例。

马斯克的话中还透露了一个细节:AI5会有单芯片和双芯片两个版本。

02

十倍参数的挑战

特斯拉AI5:创新车载计算平台的终极挑战 AI5 特斯拉 车载芯片 计算平台 第3张

2025年6月,马斯克透露特斯拉在测试一个4倍参数的新模型。两个月后他改口:跳过4倍,直接增到10倍。

“约6周后会有一个重大更新,参数量是原来的10倍。”

10月,FSD v14如期推送。

参数量涨10倍,算力、内存、带宽全得跟上。

先说算力。

参数涨10倍,计算量也涨10倍。但FSD不是云端慢慢算的语言模型——8个摄像头、每秒36帧、360度视野,必须在几十毫秒内给出判断。算力不够,要么丢帧,要么延迟,要么降精度。

HW4的算力约300 TOPS。v14通过优化勉强跑起来了,但已是极限。想跑更大的模型?想加入推理能力让车“思考”而不只是“反应”?算力不够。

推理能力是下一代FSD的核心升级

这种“思考”非一次计算能完成。多步推演,评估多个可能性,模拟未来几秒的场景。每多想一步,算力消耗翻倍。

AI5的推理性能是HW4的40倍。不是8倍、不是10倍,是40倍。多出的部分就是留给“思考”的。

再说内存和带宽。

神经网络的每个参数都要占内存。量化后,每1亿参数大约吃掉100MB。v14完整模型需约12.5GB。HW4有16GB,已接近模型运行下限。而HW3只有8GB,只能跑精简版。

内存不仅装模型,还要装“记忆”——8秒前那辆车在哪、行人往哪走、信号灯变了几次。特斯拉AI负责人Ashok说过,车载内存是限制上下文长度的主要瓶颈。想让车记得更久?先要把内存堆上去。

144GB是HW4的9倍。够装更大模型,还有余量留给更长的时间记忆。

光有内存还不够,还得喂得快。

神经网络推理时,每个参数都要从内存读到计算单元。模型跑一遍,参数读一遍。v14模型约12.5GB,每秒跑30次推理,每秒要读375GB数据。HW4带宽384 GB/s。刚好够用但也只是刚好。

模型再大10倍呢?每秒3.75TB。HW4的带宽无法支撑如此规模。AI5的1.9 TB/s带宽就是为这准备的。

..." alt="文章标题 AI5 第四张"/>