旨在超越Gemini的GPT-5.2于今日凌晨正式推出,已面向所有用户开放。
上个月我刚退订ChatGPT Plus转向Gemini,现在是否需要因为GPT-5.2而重新回归?
通过以下网友的真实体验分享以及APPSO的实际上手测试,或许能为您提供决策参考。
这次终于没有出现图表绘制错误的问题
GPT-5.2此次实际上更新了三个模型:GPT-5.2 Instant、Thinking以及Pro模型。如果您已习惯Gemini 3.0 Pro中每次回答都经过思考的过程,那么在使用GPT-5.2 Thinking/Pro时,您会发现ChatGPT的思考速度明显变慢,耗时更长。
这也是当前许多获得提前体验的用户在社交媒体上分享的核心感受。即GPT-5.2相比5.1在各方面均有提升,且GPT-5.2 Pro特别适合执行专业推理任务和需要长时间处理的工作,但等待结果的过程确实更加漫长。
例如有用户分享,输入提示词“帮我绘制一张HLE测试成绩的图表”,GPT-5.2 Pro足足花费了24分钟才生成完成。
但好在所有信息都准确无误,即便图表上显示的最佳结果仍然是Gemini 3.0 Pro。
这也得益于GPT-5.2的知识截止日期更新至2025年8月,要知道GPT-5.1的知识截止日期还是2024年9月,而上个月刚发布的Gemini 3.0则截止于2025年1月。
当我们使用GPT-5.2 Thinking模型,要求它生成一张OpenAI模型发布历史的图表时,耗时并不算太长,且信息比较准确。对于简单任务,Thinking模型与Pro模型的处理时间差异会非常显著。
提示词:generate a chart graph of OpenAI model release over time
凭借“超高强度”的推理能力、最新的世界知识,以及结合图像的多模态理解和推理,GPT-5.2很快在大模型竞技场上飙升至第二名。GPT-5.2-High在WebDev(网页开发)项目中排名第二,GPT-5.2排名第六。作为对比,Gemini 3.0 Pro排名第三,第一名仍然是Claude。
LMArena官方也发布了一段实测视频,他们使用GPT-5.2完成了一系列3D建模工作,完成度相当高。但仍有网友评论说:“现在还是2003年吗?”
视频来源:https://x.com/arena/status/1999189215603753445
这种利用three.js实现的3D效果,高度依赖模型的多模态理解和推理能力,以及在编程开发、程序设计上的优化;GPT-5.2也确实对得起这0.1的版本升级。
目前网友分享的大量测试,基本都集中在构建完整的3D引擎上,GPT-5.2的表现也相当出色。例如,也有用户使用GPT-5.2 Thinking的高难度推理模式,在单页文件中构建了一个支持交互控制、并可导出4K分辨率的3D雪天冰块王国模型。
https://x.com/skirano/status/1999182295685644366
还有使用GPT-5.2 Pro实现的3D波涛汹涌哥特城市建筑。
提示词:create a visually interesting shader that can run in twigl-dot-app make it like an infinite city of neo-gothic towers partially drowned in a stormy ocean with large waves.|来源:https://x.com/emollick/status/1999185085719887978?s=20
关于3D理解和推理能力,我们也使用了Ian Goodfellow在Gemini 3.0 Pro发布后采用的提示词,即上传一张图片,然后指示模型基于该图片生成一个精美的体素艺术Three.js单页程序场景。
由于ChatGPT未在画布内直接生成,因此复制其在对话框中生成的代码,在HTML View中打开,结果如右图所示。
差异相当明显:ChatGPT虽然识别了上传图片的内容——一棵粉红色的树、一块绿地和灰色的下沉区域,以及白色的水流,但其生成的3D动画相比Gemini 3.0 Pro显得较为简陋。
我只能说,奥特曼发出的“红色警报”,恰恰印证了Gemini的真正实力。
检验编程能力的测试,必然少不了经典的六边形小球物理运动。有博主增加了小球运动的难度,全部使用闪着红光的3D小球。效果看起来非常炫酷,许多网友询问如何实现;但也有网友指出,这些小球似乎不受重力控制。
随后有网友回复说,这是在模拟太空环境。
视频来源:https://x.com/flavioAd/status/1999183432203567339
还有SVG代码测试,例如骑自行车的鹈鹕。
也有网友分享自己用GPT-5.2制作了一个森林火灾模拟器,能够调节速度、片区大小和火焰燃烧范围等参数。
我们创建了一个星球信号网页,其布局与这个森林火情可视化网页如出一辙,基本上就是将左边的星星点点替换为太空星球。
提示词:Create an interactive HTML, CSS, and JavaScript simulation of a satellite system that transmits signals to ground receivers. The simulation should show a satellite orbiting the Earth and periodically sending signals that are received by multiple
我们也用之前Gemini 3创建的拍立得案例来测试GPT-5.2。输入相同的提示词,要求它开发一个复古拍立得风格的网页相机应用。
提示词:开发一个具有复古拟物风格的单页相机应用。页面背景请设计为软木板或深色木纹材质,左下角固定一个纯CSS或SVG绘制的拟物化拍立得相机模型,其镜头区域实时显示用户摄像头画面;交互逻辑上,当用户点击快门按钮时,播放快门音效,并让一张带有白色边框的相纸从相机顶部缓慢吐出;请利用CSS滤镜让滑出的照片初始状态为高模糊且黑白,在5秒内平滑过渡到清晰全彩状态;最后,所有显影完成的照片必须支持自由拖拽,允许用户将其随意摆放在页面任意位置,且照片要有随机的微小旋转角度和阴影,点击某张照片时应将其置顶,从而形成一个逼真的自由照片拼贴墙。
令人稍感意外的是,GPT-5.2一次就成功生成了,ChatGPT现在也能制作拍立得应用了。
之前我们测试Gemini 3.0 Pro时,它最强大的能力一方面体现在编程,另一方面是无需我们输入过多提示词,只需丢给它一个截屏或视频,要求复刻,Gemini就能做到。
这次我们同样丢给它一个视频,要求复刻这个古诗词生成网页。
https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581
对比之前GPT-5.1完全无法识别上传视频的配色方案,这次它算是有所进步。不过,由于Gemini生成的网页可以直接集成AI功能,通过调用Gemini的API实现;而ChatGPT尚未将AI引入这些生成的网页,所以这里的诗歌内容只能是预先写好的那几首。
除了经典的编程能力测试和创建单页HTML文件,也有网友用它编写Python代码。
网友输入的提示词是“write a python code that visualizes how a traffic light works in a one way street with cars entering at random rate.”(编写一个Python代码,模拟单行道交通灯的工作原理,并可视化随机速率进入的车辆)。
他同时测试了GPT 5.2 Extended Thinking和Claude Opus 4.5,结果一目了然。只能说,经常有读者询问我们最好的编程模型是哪个,Claude能受到众多开发者青睐,并非没有原因。
下图是GPT-5.2,来源:https://x.com/diegocabezas01/status/1999228052379754508
而且,之前Claude模型最大的缺点可能是价格较高,Claude Opus 4.5输入每百万Token为5美元,输出为25美元。现在GPT-5.2的价格也跟进了,相比GPT-5.1,整体上涨约40%,GPT-5.2 Pro的输入为21美元,输出为168美元。
在官方发布博客中,OpenAI提到GPT-5.2在图像能力上也有所提升。
GPT-5.2 Thinking是我们迄今为止最强大的视觉模型,在图表推理和软件界面理解方面的错误率降低了约一半。
并且它给出了一个示例:给一张看起来模糊的主板图片,用AI添加一些带有方框的标记;对比GPT-5.1,GPT-5.2虽然也会犯错,但标记了更多区域。
可是Nano Banana Pro呢?有网友用Nano Banana Pro去除了图片上的标注信息,然后重新要求它打上新的目标定位方框,您认为哪个更好?
从左到右依次为GPT-5.1、GPT-5.2、Nano Banana Pro|图片来源:https://x.com/bcaine/status/1999212747213656072
我的感受是:ChatGPT为何要在别人擅长的领域“自取其辱”?Nano Banana处理这类图像任务,目前完全可以称得上断层第一,即便GPT-5.2标注了更多信息,但许多检测框定位并不准确。
编程和图像能力相比前代GPT-5.1有了大幅提升,如果您一直是ChatGPT的用户,应该能直接感受到升级带来的差异。但如果与其他模型对比,编程和图像方面的体验,仍未能像Nano Banana推出时那样做到遥遥领先。
在关于审美的网页设计上,也有网友分享了他用GPT-5.2创建的一些前端网页,大家可以看看这次前端程序员是否又要被“淘汰”一遍。
与之前泛滥的渐变紫风格相比,GPT-5.2的设计水平确实有所提升,但正如博主自己所言,GPT-5.2似乎特别喜欢在屏幕上绘制方框,到处都是层层叠叠的网格。
关于设计能力,也有一个专门榜单,GPT-5.2突飞猛进,从之前排名十名开外的GPT-5.1,一跃升至第三名,不过得分最高的仍然是Gemini 3.0 Pro。
我们也给GPT-5.2提出了一些要求,让它为一家AI公司创建“高大上”的首页。结果是,GPT-5.2确实钟爱方框设计;而且渐变紫风格怎么又出现了。
提示词:You are the top 0.1% designer and developer for the world"s cutting-edge innovation on front-end design and development. You are tasked to create a full landing page with {Dither + Shaders} using {WebGL + ThreeJs} in the styling of an uploaded image for the AI company. - Focus mainly on the design part, not the development. Import all necessary files and libraries: Three.js、WebGL、GSAP、Any other animation libraries related to 3D development.
最后关于写作能力,根据一些获得超前体验的用户反馈,GPT-5.2已开始有能力完成长篇幅小说的创作。
例如,当ChatGPT被要求生成50个情节创意时,它会全部完成,而不是像其他模型那样只生成一部分。而被要求写一本200页的书时,ChatGPT也没有直接拒绝,而是真正尝试了,不仅构建了整本书的结构,甚至还生成了PDF文件。
网友表示,尽管书页内容较为薄弱,篇幅也短……毕竟它目前不可能一口气写出一本可出版的小说,但能开始真正执行任务,提供50个创意,撰写200页书,说明其具备足够的思维深度。
GPT-5.2最引人注目的地方在于它能够出色地遵循指令……不是基本的按指示操作,而是真正完成所描述的整个任务。
目前GPT-5.2应该已逐步推送给所有用户,您的上手实测体验如何?
GPT-5.2的升级,尚不足以让我从Gemini转回。虽然它在多项榜单中刷新成绩,无论是官方发布还是公开测试,都取得了不错的表现。但具体上手时,在生成3D程序部分,代码报错仍是常事,整体审美风格也未实现重大突破,且价格如此高昂。
网友锐评
Gemini方面也并未停步,持续给奥特曼施加压力。今天凌晨,虽然没有发布新模型,但推出了重新设计的Gemini Deep Research,并且可通过API访问,未来还将在Gemini、Google搜索、NotebookLM中升级。
全新的Gemini深度研究Agent在人类最后的考试(HLE)中以46.4%的得分击败了刚发布的45.5%的GPT-5.2 Thinking(最高为GPT-5.2 Pro的50.0%),并且在Google自家推出的DeepSearchQA测试和BrowseComp测试中取得了优异结果。
奥特曼的红色警报,大概还得再亮一阵子了。
本文由主机测评网于2026-02-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260223881.html