在CES巨幕之下,老黄的PPT俨然成为了中国AI的「荣誉殿堂」。DeepSeek与Kimi傲然占据C位,预示着算力新时代的到来。
2026年的CES科技盛宴上,一张PPT瞬间点燃了整个AI圈。老黄在主旨演讲中,中国大模型Kimi K2、DeepSeek V3.2,以及Qwen赫然出现在屏幕上,位列全球开源大模型的前列,性能正逼近闭源模型。
这一刻,是中国AI的荣耀时刻。
此外,OpenAI的GPT-OSS和老黄自家的Nemotron也赫然在列。
值得一提的是,DeepSeek-R1、Qwen3和Kimi K2代表着MoE路线下的顶级尝试,仅需激活少量参数,便大幅降低了计算量和HBM显存带宽的压力。
在下一代Rubin架构亮相的核心环节上,老黄还选用了DeepSeek和Kimi K2 Thinking来展示性能。在Rubin的强力加持下,Kimi K2 Thinking的推理吞吐量直接飙升了10倍,而token成本更是暴降至原来的1/10。
这种「指数级」的降本增效,无疑宣告了AI推理即将进入真正的「平价时代」。
在计算需求暴涨的PPT页面上,480B的Qwen3和1TB的Kimi K2成为代表性模型,验证了参数规模每年以十倍量级增长的趋势。
不得不说,老黄整场发布会上,中国AI模型的含量确实超标了。
无独有偶,英伟达去年12月的一篇博客中,也将DeepSeek R1和Kimi K2 Thinking作为评判性能的标杆。实测显示,Kimi K2 Thinking在GB200 NVL72上性能可以暴增10倍。
另外,在SemiAnalysis InferenceMax测试中,DeepSeek-R1将每百万token的成本降低至原来的十分之一以下。包括Mistral Large 3在内也获得了同样的十倍加速效果。这意味着复杂的「思考型」MoE部署到日常应用已经成为了现实。
本文由主机测评网于2026-06-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260647608.html