在智谱宣布开源GLM-5的不到半天内,MiniMax迅速跟进,推出了M2.5编程模型。
模型发布当日,智谱股价大涨,一度飙升超过25%,周涨幅达77%,市值突破1700亿港元。
MiniMax的涨幅也一度达到20%,总市值超过1800亿港元。两家公司的股价表现均远超大盘。
这种涨幅在港股AI板块中实属罕见。
要知道,智谱在1月8日IPO时,发行价为116.2港元,市值为518亿港元。短短一个月,市值翻了三倍多。
此外,智谱和MiniMax选择春节前的最后工作日发布模型,也是有其战略考量。
2月12日,是企业和开发者春节前最后的工作窗口。
此时发布模型,既能赶在假期前完成技术社区的首轮传播,又能让开发者在春节长假期间有充足时间试用和讨论。
此前,我本以为春节窗口期可能是AI领域的红包大战。但事实证明,并非如此。
春节期间,AI产业进入了“万模齐发”的盛况。
从1月底开始,阿里的Qwen3-Max-Thinking、月之暗面的Kimi 2.5、阶跃星辰的Step 3.5 Flash等模型接连发布。
随后在2月8日,阿里千问团队向Hugging Face提交了Qwen 3.5的支持代码,确认新模型即将到来。
字节跳动则计划在2月14日推出豆包 2.0,该版本包含Seedream 5.0和SeedDance 2.0的完整矩阵。
至于DeepSeek的V4版本,虽然是否会在春节期间发布仍存疑,但即便不发布新版本,市场也已经足够热闹。
真正的战场在于模型能力本身,而非红包大战。
花旗银行曾在1月26日指出,2026年将标志着AI助手从技术验证迈向全民级应用的拐点,而春节正是检验用户习惯养成的关键窗口。
GLM-5的核心定位是面向复杂系统工程与长程agent任务。
如果说过去的AI编程工具只是帮你写代码,那么GLM-5则是帮你完成整个系统工程。
智谱将这一模式称为“agent engineering”,并表示这是“vibe coding”的下一阶段。
这一说法并非空穴来风。前OpenAI联合创始人兼AI主管安德烈·卡尔帕西(Andrej Karpathy)在“vibe coding”实践一周年时曾表示,开发者的角色正在从“写代码”转向“编排AI agent”。
GLM-5在某种程度上是对这一趋势的回应。
几周前,开源社区曾流传一个名为“Pony Alpha”的神秘模型。它能进行长程交互、拆解复杂任务、在多轮对话中保持稳定上下文,一度引发广泛猜测。
如今答案揭晓,Pony Alpha正是GLM-5的匿名测试版本。
GLM-5在技术规格上实现了显著跃升。参数量从GLM-4.7的355B(激活 32B)扩展至744B(激活40B),预训练数据从23T token增加到28.5T token。
更大的参数规模意味着更强的知识储备和推理能力。但更关键的是GLM-5的两项创新。
第一项是名为“Slime”的异步强化学习框架。
这套系统支持模型从长程交互中持续学习,在处理需要数十步操作的工程任务时保持策略一致性。
传统的AI编程工具在短对话中表现优秀,但任务链条拉长后,模型容易犯错,前后逻辑出现断裂。Slime框架的设计初衷是让模型在长周期任务中保持“记忆”和“目标感”。
第二项是集成了DeepSeek的稀疏注意力机制(DSA)。
这套机制能让模型在保持长文本处理能力的同时,大幅降低部署成本。DSA的机制让模型在识别关键逻辑和重复模板时更高效,从而提升整体运行效率并降低运行成本。
根据智谱的测试分数,GLM-5在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的高分,是目前开源模型的最高分数。
本文由主机测评网于2026-07-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260748806.html