苹果公司近期重启了与谷歌的战略协作,正探讨采用谷歌的Gemini人工智能模型,为计划中全面升级的Siri提供技术支持。
据彭博新闻社报道,预计于2026年推出的Siri升级版本,将可能以定制化大型语言模型的形式亮相,该模型的核心技术由谷歌的Gemini聊天机器人驱动。
这是苹果在过去数月探索外部合作伙伴关系的最新举措。一旦这笔潜在的“世纪联姻”达成,不仅是Gemini技术实力获得业界顶级认可的标志,更将使其影响力横向扩张至全球数亿iPhone用户,成为一个里程碑事件。
这将为谷歌AI技术开辟前所未有的广阔应用场景和数据反馈循环,为未来的商业化路径,包括可能的API授权和订阅服务,打开一扇全新的大门。设想如果谷歌能将Gemini的能力整合进安卓和iOS两大生态,将迅速在用户规模上缩小与OpenAI的ChatGPT的差距。
对苹果而言,与谷歌的合作能延续双方在搜索业务上的良好关系,让iOS生态首次在底层接入大模型,为数以亿计的iOS用户提供尖端技术带来的体验革新和生态变革。
一年多以前,当苹果传出与多家大模型供应商商谈合作时,OpenAI曾被外界视为最有可能的合作伙伴。谷歌则因模型性能一般、发布会失误等负面因素,在苹果眼中并非首选。
时隔一年多,为何谷歌重新赢得苹果青睐?
最关键的原因在于Gemini在最近一年多取得了显著进步,无论是性能还是用户规模都实现大幅增长。
在LLM Arena等权威评测中,Gemini在多项排名中均位居第一梯队。
特别是在多模态领域,作为原生多模态大模型,Gemini一直保持性能领先。
如果说苹果的合作意向尚处“传言”阶段,那么Gemini在用户增长上的表现则是实打实的“硬数据印证”。
根据a16z发布的最新报告,Gemini正以惊人速度追赶ChatGPT。
谷歌的Gemini在网站流量方面位居第二,其网站吸引了约ChatGPT 12%的流量。在移动端,差距进一步缩小:Gemini的活跃用户数达到ChatGPT约一半水平。
增长数据尤为瞩目。Gemini的增长曲线极为陡峭,网站访问量从2月份的2.84亿次跃升至7月份的7亿次,而同期ChatGPT为57.2亿次。
谷歌在前50名网站中还有其他三款AI工具:AI Studio(第10名)、NotebookLM(第13名)和Google Labs(第39名)。
截至2025年7月,Gemini月活用户已达4.5亿,较5月份的4亿实现显著增长。
Gemini在权威编程能力测试和AI智商榜单中也名列前茅。Gemini 2.5 Pro的IQ评分高达137,在AI中位居首位,这表明其在逻辑推理、抽象思维和模式识别等复杂任务上的能力,已接近人类高阶智慧水平。
其代码编写和多模态理解能力也广受好评。从技术评测到实际用户采纳,Gemini证明了其作为新一代AI基础设施的领导地位,与OpenAI的ChatGPT差距日益缩小。
除了在大模型领域加速追赶ChatGPT,谷歌正以“全方位覆盖”的方式革新AI应用的各个赛道。
2025年8月,AI生图领域被一个神秘模型“Nano Banana”搅动。
起初,无人知晓这个奇特代号背后的产品来源,但它在各大AI竞技场上的卓越表现引发广泛关注。
直到谷歌揭晓答案:Nano Banana正是Gemini 2.5 Flash Image的代号。
其全新推出的图像生成模型Nano Banana已迅速成为生图圈的“焦点明星”。
Nano Banana以卓越的图像生成质量、细节把控能力和用户友好界面,在与主要竞品的直接对比中脱颖而出。
与传统图像生成工具不同,Nano Banana展现出对视觉逻辑的深度理解。它不再局限于简单“绘图”,而是能理解图像中的空间关系、物体属性,并在保持逻辑一致性的前提下完成复杂编辑任务。
其生成图像的逼真度、风格多样性及对复杂提示词的理解能力令人惊叹,许多用户形容其为“革命性”,这也助推了其病毒式传播。
Nano Banana的最大突破在于自然语言理解能力的提升。用户可用日常语言描述修改需求,模型能精准理解并执行复杂图像编辑。
这种交互方式革新,让图像编辑从专业技能变为人人可用的日常工具。Nano Banana不仅有效解决用户痛点,还深度集成Gemini的图像编辑功能,支持直接在现有图片上进行复杂操作,大幅提升工作流效率。
Nano Banana的成功不仅是模型规模的胜利,更是谷歌在用户体验和产品整合上的精准洞察。
在视频生成领域,谷歌同样展现统治级实力。其最新视频AI模型Veo3以惊人生成质量,成为视频AI领域的“领跑者”。
Veo3最大创新在于实现高保真视频与音频同步生成,包括对话、音效与环境声音的完美融合。业界评价普遍很高,认为它已从实验性工具演进为可纳入专业制作流程的实用工具。
现实中,越来越多内容创作者将Veo3纳入制作流程,用于快速原型设计和创意验证。Veo3生成的视频内容极其逼真、流畅且富有创意,质量足以颠覆传统视频制作。
Veo3的出现为影视制作、广告创意和数字内容产业带来革命性冲击。在视频长度、分辨率、一致性维护等关键指标上均有显著提升,音画同步表现尤为突出。
与此同时,Nano Banana和Veo3的协同工作流更彼此赋能。Veo3现已登陆Google Photos,进一步彰显谷歌平台实力,大幅改进原有照片转视频功能,可将静态图像转换为更高质量的短片。
更具里程碑意义的是,DeepMind推出的Genie3成为世界模型新标杆。Genie3作为720p分辨率的通用世界模型,能通过文本提示生成并模拟长达数分钟的互动式3D虚拟环境,其多样性和沉浸感前所未有,环境还会对用户操作做出反应。
它能从图像、文本、视频等多种输入中学习,并生成可交互、具物理规律的“世界”。Genie3的意义远不止生成虚拟世界,它为训练更通用的AI Agent开启新可能性——能“凭空”创造无穷无尽、风格各异的训练环境。
这不仅是AI在理解、预测和创造复杂世界方面的巨大飞跃,更预示未来虚拟现实、游戏开发乃至通用人工智能(AGI)的无限可能,为构建更智能、互动的数字宇宙奠定基础。
看到全力出击的谷歌,连马斯克也不得不感叹,谷歌将再次领跑AI时代。
他今年8月发推认为,基于谷歌拥有全球最大的算力基础能力和数据优势,它是AI行业中最有可能成为领袖的公司。
马斯克的观点为理解谷歌如何完成AI逆袭提供了基本框架——算力与数据是决定AI公司能否长期高速发展的关键前提。
谷歌早在10年前就启动专为AI任务设计的计算芯片TPU研发,历经多年迭代,TPU已成为全球最先进的AI芯片之一。因其专门针对AI计算开发,能耗效率甚至超越英伟达GPU。
而且谷歌TPU集群是除英伟达GPU外能大规模部署并进行AI训练和推理的AI芯片体系。
在后续迭代中,谷歌多年积累的AI芯片设计能力能针对自身业务和AI行业趋势更新,确保未来不会陷入算力焦虑。
当英伟达高性能GPU供不应求、被科技大厂争抢时,当OpenAI为缓解算力需求四处新建数据中心时,谷歌TPU集群提供的算力不仅能满足自身AI需求,甚至出现富余。9月3日,据报道谷歌正与小型云供应商合作,将原本自用的TPU算力向第三方销售。
作为对比,马斯克曾尝试自研AI超算芯片,但多年未果后放弃,转而采用英伟达GPU作为基础设施。这在算力成本、效率和自主性方面,与自给自足的谷歌相比处于劣势。
谷歌始于10年前的AI硬件布局,现已进入收获期。要满足Gemini日益增长的用户量带来的大规模推理需求,同时训练新模型、更新大模型能力,并支撑视频模型和生图模型的研发,若没有坚实算力基础,根本无法实现。
就像一家面馆,若面粉供应严重依赖市场上抢手的第三方供应商,很难想象它能不断推出新品或开设分店。而谷歌能自给自足的算力,正是其能多面出击、持续迭代模型能力、研发新模型的底层保障。
除了算力优势,谷歌AI业务的另一条深护城河是数据优势。多年搜索领域霸主地位让谷歌积累海量珍贵用户数据。作为全球最大视频平台YouTube的母公司,它能触及规模最大的多模态数据。谷歌发展多年的传统业务,为其在AI时代冲刺提供了取之不竭的数据金矿。
这或许解释了为何在多模态AI竞争中,谷歌发力较晚但成绩显著。除了用于训练的数据,谷歌Chrome和安卓生态能帮助将AI能力快速推向最广泛的C端市场。海量用户深度使用时产生的数据,为谷歌优化AI服务体验、识别用户痛点提供依据,从而在未来模型开发中做出更有针对性的优化和功能选择。
Nano Banana的成功正是谷歌敏锐捕捉用户需求、在模型层面进行产品化设计的最新例证。若谷歌未来能持续深度满足用户使用AI过程中呈现的需求,必将找到一条独特路径,更好地将AI能力服务于广大用户。
这也可能是苹果选择谷歌作为AI服务供应商的重要考量。毕竟只有谷歌目前拥有在设备端向接近苹果用户量级的客户群体提供AI服务的经验。
除了算法和算力优势,谷歌的反击还离不开多年积累的人才优势。随着硅谷AI人才争夺白热化,手握资金、算力和丰富数据的谷歌,对人才的吸引力毋庸置疑。人才能为AI业务带来算法创新。硅谷多年积累的AI人才储备和管理经验,以及对新入行人才的吸引力,使其始终保持行业智力高地。
例如,曾在OpenAI领导开发Sora的Tim Brooks,于2024年10月加入谷歌,负责开发新世界模型。近期发布的Genie3正是其团队的最新成果。
在硅谷AI人才争夺战中,谷歌为防核心人才流失,开出高达2000万美元的年薪。除了高薪,谷歌对顶尖人才的吸引力还在于能提供行业最好的算力和数据保障,帮助其做出最具影响力的成果。
在组织管理层面,谷歌也不断优化,系统放大人才战斗力。
去年谷歌将DeepMind和Google Brain两个研究机构合并为统一的AI战略中枢后,原本偏科研的DeepMind已成为生产AI应用的创新工厂。
去年10月,Gemini品牌化后,谷歌把Gemini App团队并入Google DeepMind;同时把Assistant的设备侧并到Platforms & Devices。前者确保“应用团队成为模型方的直接客户”,反馈与数据更快回流;后者则让端侧能力(Android/芯片/硬件)围绕“AI本地推理与协同”一体化推进。2025年移动端用户从Assistant迁移到Gemini,更将体验、数据和增长目标统一到一个坐标系内。
谷歌作为近年来论文产出最高的组织,为应对AI行业竞争,已更改AI论文发表标准。若论文成果被评估能为谷歌带来竞争优势,可能被雪藏,避免像公开Transformer那样为竞争对手做嫁衣的情况重演。
或许未来,谷歌公开发表的AI论文会减少,但像Nano Banana这样具优秀创新基因的AI产品将大量涌现。作为过去20年AI领域投入最大、为人类AI发展贡献最多、现金流最充沛的科技公司,谷歌在“AI-First”战略下,正逐渐成为科技大厂中AI改革的标杆,值得更多关注与期待。
本文由主机测评网于2025-12-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20251213672.html