文|周鑫雨
编辑|苏建勋
在沉寂许久的大模型竞技场,这个夏天再次硝烟弥漫。
最近一场战役,发生在刚刚落幕的“AI春晚”WAIC(世界人工智能大会)期间。贴身对垒的三方,是六小虎中的阶跃星辰和智谱,以及大厂中的模型强队,阿里。
7月25日,阶跃计划开源了最新的多模态推理模型:Step-3。同一天,阿里发布了全新的通义千问3推理模型。
紧接着,28日,智谱发布了最新一代基座大模型:GLM-4.5。而阿里的攻势不止于此——再次在同一天,阿里开源了通义万相2.2,涵盖文生视频、图生视频、统一视频生成三种模态。
其中,火药味十足的一幕是:7月25日,阿里最新的通义千问3被冠以“全球最强”之名;三天后,GLM-4.5就登上了全球开源模型的“SOTA”宝座——在智谱发布的综合性能榜单中,GLM-4.5排全球第3,通义千问3排第9。
△智谱GLM-4.5在模型综合性能榜单排第3。 图源:智谱
一名智谱员工告诉《智能涌现》,算法团队几乎所有人都紧盯着通义千问的更新,“太紧张了。”他说,“万一差距太大,我们后发就是个笑话。”直到GLM-4.5在多个测评集中表现优异,他才松了口气。
WAIC上的硝烟,是这两个月以来六小虎模型混战的一个缩影。
早在6月,MiniMax就在为期5天的发布日中,开源了推理模型M1和视频生成模型Hailuo 2,分别领跑上下文长度和工具使用场景,以及创造了海外爆款视频。
仅过一个月,月之暗面的新开源基础模型K2,就以横扫之势拿下了24项开源模型SOTA。
转型后的百川智能和零一万物缺席了WAIC和这一轮模型混战。
智能涌现制图。
DeepSeek V3、R1发布后,六小虎在市场上沉寂了近半年。
高管离职、人才流失已是常态。据脉脉报告,截至2025年7月初,六小虎中41.07%的员工都把状态设置成了“看机会”。
后DeepSeek时代的战役对六小虎至关重要。这份成绩单不仅影响公司后续资本操作和商业进展,更关乎它们的存亡。
更重要的是,在口碑下滑、内部动荡的半年中,六小虎急需一场翻身仗来证明自己的实力。
但后DeepSeek时代的模型战役依然艰难。DeepSeek R1的掀桌证明,要想一鸣惊人,模型不仅要性能卓越,还要发布得早。
被抢先的感觉让不少小虎心悸——我们得知,K2的训练从2024年末就开始筹备。然而,R1的抢先发布抢走了本可能属于Kimi的荣光。
为了防守,R1发布的同一天,月之暗面不得不先放出带有遗憾的版本K 1.5。最后的市场反响不尽人意。
K2发布后的好口碑某种程度上也抚平了被DeepSeek抢先的创伤。发布当晚,月之暗面联合创始人张宇韬在朋友圈写下:make kimi great again。
只是,K2的先声夺人让同样主打Coding和Agentic能力的智谱也感受到了不甘。
我们了解到,为了打赢推理模型的SOTA之战,GLM-4.5的训练已经花了将近3个月的时间。为了在多智能体任务上获得更好的表现,智谱甚至改用了MOE(混合专家模型)架构。
“一开始GLM-4.5是想做国内第一个对标Claude 4的模型。”有从业者告诉《智能涌现》,“可惜月暗的保密工作做得太好了,K2发布当天才知道技术细节。”
智谱被月之暗面打了个措手不及。最后一个月紧急加训后,GLM-4.5的Coding和Agentic能力在测评集上拔高到了“小断”K2的程度。
△WAIC上智谱的展台。图源:智能涌现拍摄
如今赛场上竞争激烈、针锋相对。这几家大模型公司也像曾经的2023年一样重回了舞台中心。
与2023年行业“重参数、搞闭源”的风气不同,如今的中国模型已经注重技术口碑的打造。
自DeepSeek起势后,开源和放出技术报告成了六小虎发模型的标配。
“模型的第一批用户肯定是开发者。如果没有抓住开发者,模型的声量是很难起来的。”一名在WAIC上的AI应用开发者告诉我们。
他将开源比作大模型触达开发者的门:“现在找到开发者很简单。大家都聚集在Hugging Face、GitHub上。模型厂商要做的就是把开源链接发到上面。”
开源是门道,剩下的就要交给技术实力。
即便经历了动荡的半年,但六小虎依然拥有远超普通创业公司的资金和人才储备。
在这一轮模型混战中,六小虎各有各的亮点:
没有绝对的赢家。但经历这一轮模型混战后,六小虎在全球模型战场上都有了姓名。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260439018.html