当前位置:首页 > 科技资讯 > 正文

GLM-5开源模型掀起AI编程新篇章

GLM-5正式发布后,其能力之强大,令之前备受关注的神秘模型Pony Alpha显得颇为保守。

此次,GLM-5不仅将开源AI带入了长任务时代,更展示了其卓越的性能。

GLM-5身兼数职,连续运行代码超过24小时,进行了700次工具调用和800次上下文切换,令人惊叹。

它甚至从零开始,用JavaScript编写了一个完整的Game Boy Advance(GBA)模拟器

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第1张

屏幕中的效果令人印象深刻,动态展示也极为流畅。

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第2张

在没有渲染的情况下,动态效果依旧出色。

对于AI而言,这是一个极具挑战性的工程任务,涉及了500多条CPU指令集、内存分页机制、音频子系统和图形渲染时序等。

即使一条指令出错或一次文件写入偏差,整个项目都可能崩溃。

但GLM-5在无并行、无参考代码、关闭网络搜索的条件下,依然表现出色。

从视频结果中,我们可以看到GLM-5的稳定性:

工具调用稳定:第700次与第一次在语法、格式、准确度上毫无差异;

指令遵循持久:上下文切换800次后,依旧遵守Meta-Prompt的规范;

工作判断稳定:GLM-5能准确判断何时进行测试、信息记录、切换策略等;

上下文可靠:每次清空后,GLM-5都能从笔记和文件中恢复工作状态。

网友纷纷赞叹:

它(GLM-5)可以制作精美的CAD模型!

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第3张

目前,GLM-5的评测结果已出炉,在权威榜单Artificial Analysis中,其水平已与Claude Opus 4.5比肩

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第4张

在主流基准测试中,GLM-5的编程能力与Claude Opus 4.5持平。

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第5张

在衡量模型经营能力的Vending Bench 2中,GLM-5取得了开源第一的成绩。

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第6张

尽管Claude Opus是闭源产品,但GLM-5这个开源模型的崛起,依然引发了网友的欢呼:

感谢开源!

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第7张

那么,作为开源界的首位“全栈架构师”,GLM-5还有哪些实力等待我们探索呢?

已有申请上架App Store的动向

我们的测试将在Claude Code中通过调用GLM-5 API的方式进行。

首个测试是制作一个考验模型逻辑闭环能力的游戏——要求GLM-5从零生成一个3D版大富翁:

GLM-5开源模型掀起AI编程新篇章 GLM-5 开源AI 长任务时代 编程能力 第8张

“开源,再次胜利”

“开源大模型完成了一次从助手到独立工程师的质变。”