当前位置:首页 > 科技资讯 > 正文

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元

太震撼了!

仅仅半个月时间,谷歌DeepMind便正式推出了在IMO竞赛中斩获金牌的顶尖模型——Gemini 3 Deep Think。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第1张

今年夏季,Gemini 2.5 Deep Think分别在IMO和ICPC国际大赛中成功摘得金牌。

而这一次,谷歌为其注入了全新活力——Gemini 3。

凭借独特的「并行思考」能力,Gemini 3 Deep Think能够轻松应对超高难度的数学与科学难题!

在基准测试中,Deep Think全面超越了Gemini 3 Pro,尤其是在HLE测试中,未借助任何工具便拿下了41%的高分。

同时在ARC-AGI-2上,以45.1%的成绩领跑全球。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第2张

下面的实例中,基于同一指令,让Gemini 3 Pro和Deep Think版根据一张博物馆展馆屋顶的草图,创建一个精确的交互式3D场景。

显而易见,后者在还原度上几乎与原图实现了1:1复刻,并且在交互体验上,光影变化也完全符合物理逻辑。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第3张

今天,Gemini 3 Deep Think已在Gemini App上线,所有Ultra用户均可立即体验。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第4张

最强IMO金牌模型震撼登场

Gemini 3 Deep Think正式开启了「深度思考」的全新纪元,再次拓展了智能的边界。

Gemini 3 Deep Think基于前代Gemini 2.5 Deep Think迭代而来,在推理能力上实现了质的飞跃。

它专门用于攻克那些连当今最顶尖模型都感到棘手的复杂数学、科学及逻辑难题。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第5张

在多项基准测试中,Gemini 3 Deep Think均取得了行业领先的成绩。

在Humanity’s Last Exam(无工具辅助)中刷出41%的高分,并在ARC-AGI-2(配合代码执行)中创下45.1%的新纪录。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第6张

在ARC-AGI-1和ARC-AGI-2上,Gemini 3 Deep Think的实力堪称无「模」能敌。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第7张

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第8张

之所以如此强大,是因为Deep Think采用了「并行推理」机制,能够同时思考并探索多种假设。

在谷歌DeepMind放出的更多演示中,可以进一步看出Gemini 3 Deep Think的卓越之处。

如下所示,让它打造一款3D版多米诺骨牌游戏。在关卡设置中,Deep Think既展现了创意又带来了惊喜,而且还模拟出了真实的碰撞物理效果。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第9张

这个例子要求Gemini 3 Pro和Deep Think分别在单个HTML文件中创建程序化生成的地球类行星。

左右对比一眼就能看出,Deep Think明显更具创造力。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第10张

另有开发者实测后惊叹道,Gemini 3 Deep Think具备惊人的能力。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第11张

上传一张玻璃瓶的照片,让它生成一个软橡胶材质的同款瓶子掉在地上的3D动画。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第12张

有网友激动地表示,按照这个发展速度,我们将在2026年真正实现AGI!

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第13张

华人科学家领衔,AGI王牌队全力冲刺

同在今天,谷歌DeepMind官宣,将在新加坡组建一支全新的精英团队。

它将由华人科学家Yi Tay率领,专攻高级推理、LLM/RL,并推动Gemini、Gemini Deep Think等前沿SOTA模型的演进。

Yi Tay将向位于山景城、由谷歌Fellow级大佬Quoc Le领导的团队汇报。

恰好,这一团队正是Gemini Deep Think在国际竞赛中夺下金牌的核心力量之一,同时也在Gemini上取得了重要突破。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第14张

Yi Tay表示,我们会从一支规模不大但实力超强的小团队起步。

因为在大模型的时代,「人才密度」比什么都关键。

关键是,这个团队还能与AI领域的传奇大神联动研究,其中就包括「推理之王」Denny Zhou、「香蕉」背后的男人Mostafa Dehghani、AI界的「GOAT」Noam Shazeer。

同时,还有很多「神仙队友」一同加入研究,包括生成式检索的发明人Vinh Q. Tran、IMO金牌项目总负责人Thang Luong、思维链开创者Xuezhi、日本顶尖AI大神Shane Gu等人。

过去几个月,谷歌DeepMind便开始秘密招募全球顶尖人才。

这一项目得到了Demis Hassabis、Jeff Dean等内部高层的大力支持。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第15张

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第16张

如今,他们继续发出英雄招募帖,邀请有志之士加入通往AGI的关键赛道。

用不了多久,这支新加坡团队很快就会成为一支战斗力爆表的队伍。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第17张

Gemini 3爆发式增长15%流量

随着Gemini 3 Pro的强势发布,其网页端的市占率再创新高,突破15%大关。

与此同时,Grok也凭借着4.1版本的发布持续增长。

ChatGPT在流量上依然断崖式领先,但份额却在持续下降。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第18张

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第19张

Gemini延续增长势头,访问量达到13.51亿次,较10月增长14.3%。ChatGPT跌破60亿次大关,网站访问量降至58.44亿次。

这是继7月之后,ChatGPT在2025年出现的第二次环比下滑。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第20张

尽管在11月18日(Cloudflare宕机当天),ChatGPT创下了单日2.33亿次访问的历史纪录,但这并未扭转整体流量的跌势。

此外,Grok网站访问量达到2.344亿次,创下历史新高,较10月增长14.7%。

这也是该网站自启用当前域名以来,首次实现连续两个月的流量增长。

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第21张

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第22张

谷歌DeepMind推出Gemini 3 Deep Think:最强IMO金牌模型引领并行思考新纪元 Gemini Think  IMO金牌 并行推理 谷歌DeepMind 第23张

参考资料:

https://x.com/GoogleDeepMind/status/1996658401233842624?s=20

https://x.com/YiTayML/status/1996640869584445882?s=20

https://x.com/Similarweb/status/1995792272785310186