当前位置:首页 > 科技资讯 > 正文

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。

谷歌AI强势回归:Gemini 3震撼发布,参与规模堪比登月壮举!全栈专家深度剖析工程协作之道。

随着Gemini 3的正式亮相,谷歌再次在人工智能领域确立领先地位!

曾一度被视为「追赶者」的谷歌,如今凭借技术突破、战略调整和资源整合,全力夺回生成式AI时代的话语权。

近日,谷歌DeepMind首席技术官Koray Kavukcuoglu与谷歌AI Studio产品负责人Logan Kilpatrick共同解读Gemini 3发布盛况,探讨AI前沿创新及AGI发展路径。

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。 Gemini 3 谷歌AI AGI 工程协作 第1张

这场45分钟的对话,聚焦模型优化、工程协作与生成媒体崛起,全面揭示了谷歌AI的战略蓝图。

此次升级绝非简单的「又一款大模型」,而是谷歌向世界宣告——

我们将与全球用户携手,共同构建下一代智能系统。

与用户共创,一切才刚刚开始

Gemini 3的问世,标志着AI行业迈入「共建AGI」的新纪元。

「我对当前的进展感到无比振奋。」Koray在现场难掩激动之情,

我们确实在多条技术线上实现了突破。这就是我们通向AGI的方式:脚踏实地、全力以赴。

这不仅是一项实验室成果,更是一场面向全球用户的「协同实验」。

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。 Gemini 3 谷歌AI AGI 工程协作 第2张

「我们正与用户并肩,共同塑造AGI的未来。世界已经改变,新技术正在重新定义人们的期待。」

他微笑着补充:「突然间,更多人拥有了创造的能力。让一切想象变为现实。」我们正处在一个激动人心的时代。

Koray指出,许多人仍将AGI想象为实验室里的「象牙塔」模式,但现实恰恰相反——

我们并非闭门造车,而是在与整个世界共同推进AGI。

他强调,AGI的实现依赖于可靠的系统工程。要构建稳定、安全、可信的系统,必须从底层开始夯实基础。

谷歌秉持工程师思维,从一开始就将这些要素纳入考量。

他介绍道,在Gemini的训练过程中,安全团队、安全技术乃至每一位模型研发人员,都深度参与了模型训练的后期阶段。「我们不会等到模型完成才进行安全检测,而是将安全性作为核心目标,与模型能力迭代同步推进。」

Gemini 3的发布不仅是一次技术迭代,更是谷歌多团队协同作战的典范。Logan感慨:「这或许是Google历史上参与人数最多的技术发布,规模仅次于NASA登月。」Koray对此深表赞同。

从2.5到3.0:Gemini加速进化

主持人Logan Kilpatrick作为DeepMind团队成员,上次与Koray同台还是在Gemini 2.5发布时,当时他们在I/O大会上聆听Dennis和Sergey畅谈AI。

彼时,Logan已感受到技术迭代的迅猛——如今看来,步伐从未放缓。

Koray对研究进展充满热情。他表示,从数据处理、预训练到后训练,每一个环节都离不开创新:

越是贴近真实场景,模型的触角越广,反馈信号越丰富,由此催生的创意就越多。

我们将面临越来越复杂的问题,而正是这些挑战驱动我们逐步逼近智能的本质。

在某些基准测试上,AI已接近饱和。

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。 Gemini 3 谷歌AI AGI 工程协作 第3张

有人担忧这是否意味着进展停滞?

Koray并不认同这种观点——

测试集本就是技术尚未突破时设定的,随着时间推移自然会被「攻克」。

要提升模型能力,必须不断设立新基准。这是机器学习的常态:基准推动模型进化,而新模型又促使我们重新定义基准。

技术进步不靠「刷分」,而靠不断拓展边界。

以GPQA、人类终极考试等高难度测试为例,最初模型几乎得分为零,如今已能达到40%以上,这充分证明了模型的进步。尽管「每次仅提升1%」,但这1%往往意味着突破了极其复杂的难题。

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。 Gemini 3 谷歌AI AGI 工程协作 第4张

在Koray看来,衡量进步最重要的标准是——

用户真实使用:

科学家、学生、律师、工程师都在借助Gemini模型进行写作、编程、内容创作……

在现实世界中,AI模型持续创造价值,这才是真正的进步。

落地才是AGI的关键

如今,AI基准测试层出不穷。究竟如何确定持续发力的方向?

谷歌始终聚焦以下两大领域:

指令遵循——模型必须准确理解用户请求并做出响应。

国际化。「作为全球化公司,我们必须确保模型服务全球用户。」

在技术层面,Koray特别强调了几个关键词:

函数调用、工具调用、智能体行为、编程能力……

他解释道:「AI模型不仅能自然调用各类工具和函数,更能自主编写工具。某种意义上,模型本身就是一种工具。」

这不仅赋予模型推理能力,更拓展了其应用场景。

而代码能力之所以重要,不仅因为「人人皆可编程」,更因为代码是数字世界的底层语言——掌握代码,便能创造一切。

这意味着,谷歌让更多人拥有了「创造的能力」。

Logan提到,此次Gemini 3发布还同步上线了谷歌新平台Anti-gravity,一个AI驱动的编程智能体平台。他好奇这种产品层面的「共建」是否对模型训练有实际助益。

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。 Gemini 3 谷歌AI AGI 工程协作 第5张

Koray毫不犹豫地回答:「至关重要。」

在他看来,Anti-gravity不仅是一款产品,它让模型直面用户,尤其是开发者。谷歌能从中获取一手反馈,明确模型改进方向。他举例道:

不仅是Anti-gravity,AI Studio、Gemini App、搜索的AI摘要等功能——我们通过这些产品获得了海量反馈。

正是这种与产品的深度融合,帮助我们洞察用户的真实需求。

他强调:「AI模型要真正有用,必须在真实场景中落地。这才是关键。」

Gemini 3很强,但远未「满分」

Gemini 3刷新了多项基准测试,但谷歌清醒地认识到前路依然漫长。

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。 Gemini 3 谷歌AI AGI 工程协作 第6张

他们坦然承认——

写作、编程仍不完美。

尤其在「智能体行为」和「工具使用」方面,Gemini还有巨大提升空间。

Koray坦言:「并非我们有意忽视智能体与工具调用,主要原因是当时离真实应用场景还不够近。」

他说,Gemini项目初期更多是在研究环境中推进,但随着项目逐步产品化,其「开发环境」也越来越贴近实际需求。越贴近用户,越能理解真实的技术挑战。

五年前,Gemini研究人员还在撰写论文、从事学术研究。而现在,Gemini每六个月迭代一次,每月甚至每六周就有更新。

过去是25人署名论文,如今是2500人参与Gemini 3项目。

回首过往,令人感慨万千!

他认为,这正是谷歌的核心优势之一——从芯片、数据中心、网络、工程到模型算法,每一层都汇聚了世界级专家,而Gemini正是这种「全栈协作」的结晶。

「这就是为什么需要数千人协同。这不是负担,而是力量。」

统一架构:我们正在靠近「万能模型」

谈及多模态发展,Logan提到Gemini V3、Nano Banana等图像与视频生成模型的进展,并好奇:「视频模型真的是构建AGI的一部分吗?」

Koray回顾了过去十几年的发展:

早期的生成模型聚焦于图像,因为图像更便于观察和理解物理规律。

过去,人们以为文本进展会缓慢,但事实证明文本是最容易突破的领域

如今,图像、视频、音频等多模态模型的能力正在回归,它们与文本模型的架构也日趋统一。

他举例说,Nano Banana模型首次实现了用户与图像生成模型的对话式交互,「文本模型带来的世界理解能力,与图像模型带来的感知能力相结合,将产生强大的协同效应。」

他还解释道:

现在模型架构确实越来越趋同,过去图像模型和文本模型架构差异显著,但如今正自然融合,因为大家都在追求更高的效率与表现力。

尽管统一架构是大势所趋,但Koray指出:图像生成依然极具挑战性。

因为AI模型的学习信号主要来自输出空间,而当前学习信号以代码和文本为主,图像则困难得多。

图像不仅要像素级精准,还要概念上连贯。每个像素的存在都必须契合整体主题。这种双重约束,使得训练异常艰难。

不过Koray仍保持乐观:「我们将持续探索适合的模型创新,推动统一模型真正落地。」

当Gemini模型能将长篇复杂文本的核心概念,用一张图精准表达,那便是魔法般的时刻。

谷歌AI的集体胜利:Gemini 3发布,参与人数媲美NASA登月!从芯片到算法的全栈专家合力,Koray与Logan剖析工程协作的魅力。 Gemini 3 谷歌AI AGI 工程协作 第7张

他认为,这正是多模态模型的价值所在——AI不仅能理解抽象概念,还能以最直观的方式呈现。

诚实面对落后,是唯一的出路

加入谷歌初期,Logan曾有一种「谷歌是AI界挑战者」的感觉。尽管技术底蕴深厚,外界却并不看好。

Koray点头回应:「我当时也有同感。坦白说,在大语言模型兴起之初,我们确实不在最前沿。」

这也是一次深刻的教训——永远不要忽视新兴方向的重要性。

启动Gemini项目时,谷歌对形势有清醒认知:「我们落后了,必须迎头赶上,我们尚未掌握关键能力。」

初期,Gemini团队必须快速学习同行经验,同时探索自己的创新路径——无论是模型结构、训练流程、数据使用还是协作方式,都进行了深度调整。

如今,他们已形成独属于谷歌、属于Gemini的系统化打法。

外界常诟病谷歌庞大、迟缓、不够灵活。但Koray持不同观点——

规模并非阻碍,而是独特的力量源泉。

谷歌下一阶段如何超越自我?

Koray的回答一如既往地冷静清晰:

我们必将持续进步,每个方向都有优化空间。

我们的目标始终明确——构建真正的智能。我们将倾注全部心力、创新力和资源,稳步前行

Gemini的下一阶段永远在前沿,也永远准备好革新。

参考资料:

https://www.youtube.com/watch?v=iFqDyWFuw1c&t=1s

https://fortune.com/2025/11/25/google-sleeping-giant-dark-horse-ai-race-gemini/