当前位置:首页 > 科技资讯 > 正文

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI

谷歌通过Gemini 3版本、自主设计芯片、强大数据资源与顶尖研究团队,正重新反超OpenAI,并推动市场份额与用户活跃度快速上升。在谷歌与OpenAI的巅峰对决中,辛顿押注谷歌会获胜。

「我预测,谷歌必将取胜」!

近日,AI教父辛顿公开表示:

谷歌已经开始赶超OpenAI。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第1张

「AI教父」辛顿(Geoffrey Hinton)

更让OpenAI扎心的是,他还补充道:

令人惊讶的是,谷歌竟耗费如此长时间才实现反超。

三年前,ChatGPT的发布曾让谷歌内部触发「红色警报」。

如今,拉响警报的换成了OpenAI。

谷歌最新发布的Gemini 3版本获得业界广泛赞誉,有专家认为其性能已超越OpenAI的GPT-5。

Nano Banana Pro图像模型也备受用户青睐。

辛顿指出,自研芯片是谷歌的一大显著优势。

此外,他还提到谷歌拥有众多优秀研究员、海量数据及庞大数据中心。

这些综合实力让辛顿相信谷歌将超越OpenAI并赢得最终胜利。

从市场反馈看,Gemini 3、Nano Banana Pro等模型的发布,AI与搜索产品的整合,以及TPU与Meta达成十亿美元订单,共同推动谷歌母公司市值接近4万亿美元。

辛顿在谷歌大脑任职期间助力推动了早期AI研究。

他表示,谷歌曾长期引领AI发展,但后来变得更为谨慎。

谷歌发明了Transformer架构,并比其他公司更早拥有大型聊天机器人。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第2张

辛顿提到,当微软2016年发布的「Tay」因发表种族歧视推文而迅速下架后,谷歌开始格外小心。

谷歌一直拥有良好品牌声誉,他们担心类似事件会损害名声。

此前,谷歌CEO Sundar Pichai也表示,公司未更早推出聊天机器人是因为产品成熟度不足。

过去,谷歌也曾经历一些不顺利的产品发布。

去年,谷歌因用户投诉其AI图像生成器在历史人物肤色上出错、显得过度政治正确,而被迫暂停该功能。

其早期的AI搜索摘要,也曾给出荒唐建议,例如为防披萨芝士滑落可涂抹胶水。

Gemini 3 Pro视觉推理能力突破

在谷歌官方介绍中,Gemini 3 Pro被称为「迄今最强大的多模态模型」。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第3张

谷歌在介绍Gemini 3 Pro时,强调了一个关键进步:

从「识别」迈向「理解」。

Gemini 3 Pro在文档、空间、屏幕和视频理解方面表现卓越,实现了从简单识别到真正视觉与空间推理的跨代提升。

它在MMMU Pro和Video MMMU等复杂视觉推理基准上刷新纪录,并在文档、空间、界面及长视频理解等特定任务测试中取得出色成绩。

文档理解

现实世界的文档常混乱、缺乏结构、难以解析,常包含交错图像、难辨手写字、嵌套表格、复杂数学符号和非线性布局。

Gemini 3 Pro在文档处理能力上实现重大突破,从精准OCR到复杂视觉推理均有显著提升。

它不仅能看懂「内容」,还能理解「关联」与「逻辑」。

谷歌的一项核心能力是「反渲染」:将文档画面还原为结构化代码(如HTML、LaTeX、Markdown)。

例如,它能将18世纪商人日志转换为复杂表格,或将带数学标注的图像精准恢复为LaTeX。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第4张

18世纪奥尔巴尼商人手册中的手写复杂表格

要真正理解文档,模型需准确识别文本、表格、数学公式、图形和图表,无论存在噪点或格式混乱。

除智能感知外,还需具备高级推理能力。

Gemini 3能在长文档中执行跨表格与图表的多步复杂推理。

在CharXiv基准中,它以80.5%的成绩超过了人类基线。

举例来说,用户分析美国人口普查局62页报告时提出提示词:

「比较2021–2022年货币收入与税后收入的基尼指数变化百分比;解释税后收入指标偏离原因。此外,就货币收入而言,最低收入五分位份额是上升还是下降?」

下方图片展示了模型的逐步推理。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第5张

空间理解

空间理解让模型开始理解「物理世界」。

Gemini 3 Pro可结合推理能力更好地理解物理环境。

关键能力包括指向坐标,即通过输出像素级坐标精确指向图像中的位置。

例如,可估计人体姿态或分析动作轨迹。

多个二维点串联能执行较复杂任务,这是2D图像迈向「世界模型」的关键一步。

此外,还有开放词汇指代,即模型能用开放词汇识别物体及意图。

例如在机器人领域,用户说桌子凌乱,帮我设计垃圾分类步骤。

模型不仅看到「物体」,还知道何为垃圾、如何分类及整理。

这一能力也延伸至AR/XR设备,用户可请求AI助手「根据用户手册指出螺丝位置。」

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第6张

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第7张

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第8张

屏幕理解

Gemini 3 Pro的空间能力在理解桌面与移动设备界面时表现突出,让计算机使用型智能体更可靠,可自动化重复任务。

屏幕理解还能支持QA测试、用户指导及UX分析。

视频理解

视频是最复杂的数据形式:信息密集、变化快速、多模态且背景丰富。Gemini 3 Pro在视频理解上迈出巨大一步。

核心能力包括高帧率理解,经优化后,模型在高于1 FPS取样下能更好理解快速运动。

例如以10 FPS处理视频,Gemini 3 Pro可捕捉每次挥杆动作和重心转移,支持深入运动机理分析。

此外,「思考模式」下的视频推理能让模型跟踪复杂因果关系。

不仅能「看到发生什么」,还能理解「为何发生」。

甚至可将长视频总结为可执行应用程序。

视频不再是内容,而是知识源。

文档理解让AI不仅能识别文字,更能理解内容;空间理解让AI理解三维世界;屏幕理解让AI看懂设备屏幕动态;视频理解让AI看懂视频中的动作、原因和逻辑。

Gemini 3 Pro让AI首次像「真正能看懂世界的人」一样工作。

如果说GPT-4开启了「语言智能」时代,那么Gemini 3 Pro正开启视觉与行动智能时代。

AI不再只会说话,而是开始理解世界。

ChatGPT增长放缓,Gemini快速追赶

在互联网和AI行业,同样遵循「飞轮效应」经典模型,用户始终居于核心。

谷歌正是依靠此原则筑起搜索帝国。

每次搜索、点击都反哺反馈循环:用户行为改进排序系统,排序优化吸引更多用户。

时间一长,飞轮形成正向循环,筑起难以攻破的护城河。

根据市场情报公司Sensor Tower最新数据,ChatGPT增长势头正趋缓。

尽管它仍稳居行业第一,在移动端全球下载量中占50%,全球月活用户中占55%,但Gemini正快速追赶,在下载增速、月活增速及用户使用时长增速方面全面超越ChatGPT。

从趋势看,在用户数量和活跃度等方面,Gemini正缩小与ChatGPT差距。

截至2025年11月,ChatGPT全球月活同比增长180%,而Gemini同比增长170%。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第9张

新数据显示,ChatGPT月活在8月到11月间仅增长约6%,达约8.1亿。

Sensor Tower表示,这可能意味ChatGPT正接近市场饱和。

相比之下,Gemini全球月活在同期跃升约30%,主要受新图像生成模型Nano Banana推出后用户激增影响。

报告还指出,在美国Android用户中,通过系统内置Gemini使用服务的人数是使用独立Gemini应用的两倍。

这可能让谷歌在全球市场形成优势,因Android占主导地位,意味Gemini不再受限于移动App或网页端。

在与ChatGPT、Copilot、Claude、Perplexity和Grok等应用对比中,Gemini在整个市场的月活份额也在提升。

该机构估算,过去七个月(5月至11月),Gemini全球月活市占率提升3个百分点。

相比之下,ChatGPT全球月活市占率在过去四个月(8至11月)下降3个百分点。

来自Perplexity和Claude等竞品的压力也愈发明显。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第10张

这两款产品在2025年均迎来三位数增长:Perplexity同比上涨370%,Claude同比上涨190%。

ChatGPT截至11月全球下载量同比增长85%,但仍落后于AI应用整体110%的平均增速。

其中,Perplexity与Gemini下载量增速最高,分别达215%和190%的同比增长。

此外,Sensor Tower表示,Gemini用户日均使用时长在过去几个月翻倍增长。

截至11月,Gemini用户日均使用时长达11分钟,比3月增长120%,很可能受9月上线的图像生成模型Nano Banana带动。

同期ChatGPT用户日均使用时长仅增长6%,且与7月相比,11月使用时长下降10%。

虽然目前数据表明谷歌正逼近市场领头羊,但其近期大部分增长主要来自Nano Banana的成功。

OpenAI是否仍有胜算?

庞大用户基数及对用户心智的占领,一直是OpenAI强大护城河,也是其领先竞争对手的重要资本。

因此,OpenAI能否在与谷歌竞争中取胜,关键指标在于能否守住用户基数优势。

前段时间,OpenAI将摊子铺得较大,可能放缓模型产品迭代速度。

当面对Gemini 3、Claude Opus 4.5等模型在基准测试中突出表现时,必然造成OpenAI用户流失。

用户选择大模型时,更注重模型性能与体验,而非用户忠诚度。

此前,Salesforce CEO马克·贝尼奥夫表示,在体验Gemini 3两小时后,立刻弃用近三年的ChatGPT。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第11张

这正是奥特曼担忧之处。

几天前,奥特曼在致员工备忘录中发出「红色警报」,称要将精力拉回提升ChatGPT,其他低优先级项目暂缓。

现在,每周有近十亿人使用ChatGPT,庞大用户规模让OpenAI拥有前所未有窗口,洞察人类意图、好奇心和决策方式。

每个提示词、每段对话都能喂回模型训练、评估和强化学习,进一步强化全球可能最强的AI反馈循环。

奥特曼的「红色警报」核心,正是保护此优势。

若ChatGPT变得更好用,人们使用频率更高,使用越多循环越强,产品越优——形成不断自我加速的飞轮效应。

这也是OpenAI抵御谷歌进攻的强大堡垒。

如今,Gemini 3已吸引一波用户,OpenAI强大堡垒出现松动迹象。

在此节骨眼上,若ChatGPT质量波动或界面杂乱,用户转向谷歌将更易。

此前,不断有用户对OpenAI在产品中推送商品信息表示反感。

Google凭借Gemini 3重新领跑AI竞赛,辛顿预言其将超越OpenAI Google Gemini 3  OpenAI ChatGPT AI竞争 Geoffrey Hinton 第12张

因此,就在外部紧盯OpenAI财务状况时,奥特曼仍决定先稳定用户飞轮,将上线广告和赚钱事宜暂放。

目前,OpenAI将希望押在新模型发布上,以推动ChatGPT再次加速增长。

但AI投入成本极高,OpenAI已承诺投入数千亿美元建设基础设施,将ChatGPT推向真正全球规模。

因此,商业化不能一直拖延。

先聚焦ChatGPT稳住用户基本盘,再探索广告商业化机会,正是奥特曼在强敌压境下的重要考量。

如今,相比OpenAI,谷歌在模型上已赶上,在芯片、产品矩阵、商业化能力等方面不断巩固优势。

奥特曼是否能让谷歌再次拉响「红色警报」,可能要看新模型「Garlic」推出后的市场反应。

参考资料:

https://www.businessinsider.com/ai-godfather-geoffrey-hinton-google-overtaking-openai-2025-12

https://blog.google/technology/developers/gemini-3-pro-vision/