当前位置:首页 > 科技资讯 > 正文

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局

谷歌终于推出了Gemini 3 Pro,此次发布相当突然,风格也十分低调。

尽管谷歌此前通过图片编辑模型Nano Banana刷了一波存在感,但在基座模型领域,谷歌已经沉寂了相当长的时间。

过去大半年,行业焦点始终集中在OpenAI的新动作和Claude在代码领域的领先地位上,而版本号长达8个月未升级的Gemini几乎无人提及。

即使谷歌的云业务和财报表现亮眼,但在AI开发者核心圈层中,谷歌的存在感正逐渐被稀释。

幸运的是,小榜在第一时间体验后发现,Gemini 3 Pro并未让人失望。

但现在下结论还为时过早。当前AI赛道早已超越单纯比拼参数量的阶段,各家都在聚焦应用落地、成本控制和用户体验。

谷歌能否适应这一新环境,仍是一个未知数。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第1张

01

我让Gemini 3 Pro用一句话描述自己,它如此回应。

“不再急于向世界证明自己有多聪明,而是开始思考如何让自己更有价值。”——Gemini 3 Pro

在LMArena排行榜上,Gemini 3 Pro以1501的Elo分数登顶,创造了AI模型综合能力评估的新纪录。这一成绩相当出色,连奥特曼也发推祝贺。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第2张

数学能力测试中,该模型在AIME2025(美国数学邀请赛)的代码执行模式下实现了100%的准确率。在GPQADiamond科学知识测试中,Gemini 3 Pro的准确率达到91.9%。

MathArenaApex数学竞赛测试显示,Gemini 3 Pro获得了23.4%的得分,而其他主流模型得分普遍低于2%。此外,在Humanity"sLastExam测试中,该模型在不使用工具的情况下得分37.5%。

谷歌在此次更新中引入了名为“vibecoding”的代码生成功能。用户可通过自然语言描述需求,系统随即生成相应代码和应用程序。

在Canvas编程环境测试中,用户描述“制作可调节转速的电风扇”后,系统约30秒内生成了包含旋转动画、速度控制滑块和开关按钮的完整代码。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第3张

官方展示案例还包括核聚变过程的可视化模拟。

交互方式上,Gemini 3 Pro新增了“生成式界面”(GenerativeUI)功能。与传统AI助手仅返回文本回答不同,该系统能根据查询内容自动生成定制化界面布局。

例如,当用户询问量子计算问题时,系统可能生成包含概念解释、动态图表和相关论文链接的交互式界面。

针对不同受众的同一问题,系统会生成不同界面设计。比如向儿童和成人解释同一概念时,儿童版本偏向可爱风格,成人版本则更简洁明了。

Google Labs提供的Visual Layout实验功能展示了这种界面的应用,用户可获得杂志风格视图布局,包含图片、模块和可调节UI元素。

此次发布还包含了名为Gemini Agent的智能体系统,目前处于实验阶段。该系统可执行多步骤任务,并连接到Gmail、Google Calendar和Reminders等谷歌服务。

在收件箱管理场景中,系统可自动筛选邮件、标记优先级和起草回复。旅行规划是另一应用场景,用户仅需提供目的地和大致时间,系统会查询日历、搜索航班酒店选项并添加行程安排。该功能目前仅向美国地区Google AI Ultra订阅用户开放。

多模态处理方面,Gemini 3 Pro基于稀疏混合专家架构构建,支持文本、图像、音频和视频输入。模型上下文窗口为100万token,可处理较长文档或视频内容。

加拿大劳瑞尔大学历史学教授Mark Humphries测试显示,该模型识别18世纪手写文稿时字符错误率为0.56%,较前代版本降低50%到70%。

谷歌表示,训练数据包括公开网络文档、代码、图像、音频和视频内容,后训练阶段使用了强化学习技术。

谷歌还推出了名为Gemini 3 Deep Think的优化版本,专用于复杂推理任务。该模式目前正在进行安全评估,计划未来几周向Google AI Ultra订阅者开放。

在Google Search的AI模式中,用户可点击“thinking”选项卡查看该模式的推理过程。与标准模式相比,Deep Think模式会在生成回答前进行更多步骤分析。

除官方资料外,我还将Gemini 3 Pro与ChatGPT-5.1进行了对比。

第一个对比是生成图片。

提示词:给我生成一张iPhone17

ChatGPT-5.1

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第4张

Gemini 3 Pro

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第5张

主观而言,ChatGPT-5.1更符合需求,因此此回合ChatGPT-5.1胜出。

第二个对比是两者智能体水平。

提示词:去研究字母榜微信公众号,评论该号水平

GPT-5.1

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第6张

Gemini 3 Pro

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第7张

尽管主观上更喜欢Gemini 3 Pro的解读,但其过于鼓吹,而ChatGPT-5.1能指出小榜的不足,更客观真实。

最后是代码能力,这是所有大模型关注的重点。

所选项目是GitHub上近期星数很高的LightRAG,它通过整合图结构增强上下文感知和高效信息检索,改进检索增强生成,实现更高准确性和更快响应时间。项目地址https://github.com/HKUDS/LightRAG

提示词:说说这个项目如何

GPT-5.1

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第8张

Gemini 3 Pro

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第9张

同时,Gemini 3 Pro获得了业内人士高度评价。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第10张

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第11张

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第12张

02

尽管Gemini 3 Pro发布低调,但谷歌已为其预热多时。

在谷歌第三季度财报电话会上,CEO皮查伊表示:“Gemini 3 Pro将在2025年内发布。”没有具体日期和细节,却拉开了科技行业营销大戏序幕。

谷歌不断释放信号,让AI社区保持关注,却始终拒绝给出确定发布时间表。

从10月开始,各种“意外泄露”接踵而至。10月23日流传一份日历,显示11月12日有“Gemini 3 Pro Release”内部日程截图疯传。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第13张

眼尖开发者还在Vertex AI的API文档中发现“gemini-3-pro-preview-11-2025”字样。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第14张

随后,Reddit和X上出现各种截图。有用户称在Gemini Canvas工具中看到新模型身影,有人在移动应用版本中发现异常模型标识。

然后,下面这张测试数据在社交媒体流传。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第15张

这些“泄露”看似偶然,实为精心编排预热。每次泄露都恰到好处展示Gemini 3 Pro某项核心能力,每次讨论都将期待值推向新高。谷歌官方账号态度耐人寻味,转发社区讨论,用“即将到来”吊胃口,甚至谷歌AI实验室高层在发布日期预测推文下回复“思考”表情,却不肯说出准确日期。

预热近1个月,谷歌终于端上Gemini 3 Pro。然而Gemini 3 Pro性能虽强,谷歌更新频率令人着急。

早在今年3月,谷歌发布Gemini 2.5 Pro预览版本,后续陆续推出Gemini 2.5 Flash预览版等衍生版本。直至Gemini 3 Pro问世,Gemini系列在此期间无任何版本号升级。

可谷歌对手们不会等待Gemini。

OpenAI在8月7日推出GPT-5,并在11月12日升级到GPT-5.1。期间还推出AI浏览器Atlas,直指谷歌腹地。

Anthropic迭代更密集:2月24日发布Claude 3.7 Sonnet(首个混合推理模型),5月22日推出Claude Opus 4和Sonnet 4,8月5日发布Claude Opus 4.1,9月29日推出Claude Sonnet 4.5,10月15日又发布Claude Haiku 4.5。

这一系列攻势让谷歌措手不及,但目前来看,谷歌顶住了压力。

谷歌Gemini 3 Pro悄然发布:AI竞赛迎来新变局 Gemini Pro  谷歌AI 模型对比 AI竞赛 第16张

03

谷歌耗时8个月才更新Gemini 3 Pro,最大原因可能来自人员变更。

2025年7月至8月前后,微软对谷歌发起猛烈人才攻势,成功招募超过20名DeepMind核心专家和高管。

其中包括DeepMind高级产品总监戴夫·希创(Dave Citron),负责核心AI产品落地;以及Gemini工程副总裁阿玛尔·苏布拉马尼亚(Amar Subramanya),他是谷歌最重要模型Gemini的核心工程负责人之一。

另一方面,谷歌Nano Banana团队曾表示,谷歌在发布Gemini 2.5 Pro后很长时间里,纠结于AI生图领域,放缓了基座模型更新。

谷歌认为,只有攻克角色一致性、语境编辑、文字乱码这三个生成图片领域难关,才能让基座模型表现更好。

Nano Banana团队强调,模型不仅要“画得好看”,更要“听懂人话”并“受人控制”,从而让AI生图真正进入商业落地阶段。

此时回看Gemini 3 Pro,它是一份合格答卷,但在这个只争朝夕的AI战场,及格早已不够。

谷歌既然选择此时交卷,就必须面对最苛刻阅卷人——那些已被竞品“喂刁”口味的用户和开发者。接下来几个月,将不是模型参数比拼,而是生态整合能力肉搏。谷歌这头大象不仅要学会跳舞,还得跳得比所有人都快。