一张由人工智能生成的图片,描绘了OpenAI的萨姆·奥特曼与谷歌的桑达尔·皮查伊进行扳手腕较量,象征着两家科技巨头的激烈竞争。
在OpenAI成立十周年之际(美国时间12月11日),公司正式推出了新一代AI模型GPT-5.2。一个月前,谷歌的Gemini 3刚刚超越对手成为“世界最佳”,此次发布无疑加剧了全球人工智能产业的竞争态势。
在关键产品发布前,奥特曼为应对主要对手的产品迭代和人才挖角,在内部拉响了最高级别的“红色警报”。因此,GPT-5.2的亮相不仅关乎两家公司的市场地位,更可能重新定义AI产业的未来格局。
提前参与内测的HyperWrite联合创始人兼CEO马特·舒默评论道:模型能力强大,尤其在推理方面表现出色,但处理速度较慢,且应用场景较为单一,目前仅能通过ChatGPT平台使用。
“这是目前全球最优秀的模型,它可以用长达1小时的时间来处理复杂难题,并出色地完成任务。我已经离不开它。”舒默补充说。
硅谷AI专家艾莉·米勒也是内测用户之一,她将GPT-5.2定义为“专业研究员”:在深度思考和复杂问题解决上显得“严肃”且“专业”,但输出内容结构性强,对于追求快速、简洁和拟人化交流的用户可能不太友好。
“在处理复杂工作、头脑风暴和专业分析时,我可能会选择GPT-5.2。”米勒表示。
AI开发者Dp Singh同样认同上述判断,强调人工智能首次在日常专业任务(如制作演示文稿、电子表格、分析图表)中达到专家级产出水平,而不仅仅是演示场景中的表现。
GPT-5.2展现出的与人类研究员相当的专业能力,也引发了学术界专家的广泛关注。
宾夕法尼亚大学沃顿商学院教授、人工智能专家伊桑·莫利克指出:“我从未如此确信,即便人工智能发展今天停止,未来10年社会与经济仍将面临巨大变革,因为人类会想方设法利用现有模型的能力。当然,AI的进步也不可能就此结束。”
OpenAI对GPT-5.2的定位非常明确,即“迄今为止最适合现实世界专业用途的模型”。
而证明其“能力”的关键指标,就是各种基准测试和跑分成绩。
上面是OpenAI在X平台上展示的一张基准测试图(其官方新闻稿甚至未包含此图)。
可以看到,在自主研发的GDPval基准测试中,GPT-5.2在70.9%的明确任务上达到或超越了顶尖人类专家的水平,较其8月发布的GPT-5(38.8%)实现大幅跃升,也领先于Anthropic的Claude Opus 4.5(59.6%)和谷歌的Gemini 3 Pro(53.5%)。
然而,GDPval毕竟是OpenAI自家的基准测试,取得好成绩并不意外。更重要的是,行业内的基准测试数量繁多,OpenAI此次仅引用了8项不同类型的数据,而谷歌在Gemini 3的发布中可能引用了约20项基准测试,这给了选择性展示的空间——只公布表现优异的部分。
如果将上面的表格转换为折线图,可以清晰地看到,在多项基准测试中,OpenAI新发布的GPT-5.2与各家最前沿的模型差别都不明显。
可以说,AI竞赛已从OpenAI一家独大,演变为多方巨头“短兵相接”的混战局面。
《纽约时报》也提及了类似看法,并且援引行业专家观点指出,“OpenAI所谓的AI基础模型与其他公司模型之间的技术差距实际上已经不复存在。”
如果说基准测试不够直观,可以查看具体案例。下图左是OpenAI官方提供的“海浪模拟器”网页,右边是相同提示词在Gemini中生成的页面,总的来说,双方各有优势。
前面提到,由于竞争对手的步步紧逼,奥特曼在公司内部拉响了“红色警报”。从GPT-5.2和同行之间的差距来看,短期内估计难以在产品和模型层面消除这一“红色警报”。
针对这个问题,被奥特曼一手挖过来的应用业务首席执行官菲吉·西莫解释说,“红色警报是向公司发出的一个信号,表明我们需要将资源集中在一个特定领域,这是一种确定优先级的方式。”大意是红色警报并非决战生死,只是管理层展示决心、明确方向。实际上,GPT-5.2在数月之前就已经研发,只是选择在这样一个时间点发布。
问题是,如果真到了决定企业生死存亡的时刻,除了这个未能拉开明显差距的GPT-5.2,奥特曼的手中是否还有比它更锋利的武器?当然,比起在内部拉响警报,奥特曼在外部的表现显得较为放松。他在接受CNBC采访时表现出谨慎乐观:“Gemini 3对我们的业务指标产生的影响,可能比我们担心的要小。”他预计OpenAI将在2026年1月“以非常强势的地位”解除“红色警报”状态。
OpenAI刚刚迎来成立10周年,官网也发布了一条视频,介绍这家公司的起源与未来愿景。
10年前,当马斯克还在OpenAI项目组中活跃时,黄仁勋赠送了OpenAI世界上首台DGX-1服务器,各路大佬都在上面留下了签名,背景墙有一句格言“关键的问题不在于我们‘知道什么’,而在于我们如何‘运用所知’……我相信,我们每个人的责任都是——在行动时,要把自己当成全世界的命运都维系在自己肩上一样。”
十年来,OpenAI给世界带来了ChatGPT、Sora等震撼性产品,奥特曼在全球各地巡游布道,与各种硅谷巨头合作夯实算力基础。但是随着时间的推移,OpenAI从一开始的大幅度领先,到慢慢被对手追平甚至局部超越?现在的OpenAI,正处在一个茫然的十字路口。
成立初期,OpenAI声称其目标是“以最可能造福全人类的方式推进数字智能,不受产生财务回报需求的限制”。斯塔福德郡大学的AI伦理学家凯瑟琳·弗利克也强调,这一创立理念已发生巨变。因为在OpenAI复杂的架构背后,存在着一个利益错综复杂、互相绑定的营利性公司。
“现在我们有一个营利性公司,它已经完全卸下了对社会效益的任何责任,基本上接受了那种不惜一切代价增长的信条。”弗利克表示,原因在于OpenAI身处生成式AI革命的最前沿,而这里“有钱可赚”。红色警报声中,OpenAI的第一要务是优化产品体验,商业化优先级排在后面,因为这已经涉及到生死存亡,也关乎奥特曼更远大的理想——10年后可能会到达的超级智能,但这种愿景并非是OpenAI内部绝对的共识。
技术竞赛的背后,是OpenAI面临的巨大商业化与盈利压力。
奥特曼表示,OpenAI的目标是在2025年底实现相当于每年200亿美元收入的月度营收,但他承认距离整体盈利“仍有很长一段路要走”。更引人注目的是,OpenAI承诺在未来几年投入高达1.4万亿美元用于计算基础设施建设,以支撑其AI雄心。
市场调研公司Sensor Tower的最新数据显示,2025年11月,ChatGPT全球月活用户总数为8.1亿,8-11月增速仅为6%,远低于2024年同期40%以上的水平。此外,其全球市场份额在四个月内也从38%降至35%。
目前,ChatGPT是OpenAI的营收生命线。每周超过8亿的活跃用户中,约6%每月支付20美元使用高级服务。
OpenAI正试图从免费用户中挖掘更多价值,探索的方向包括在ChatGPT中引入广告,以及开发交易分成模式(例如用户通过聊天机器人购物,OpenAI从中抽成)。
西莫还证实,OpenAI计划在推出“成人模式”(可能允许成人内容)前,先引入用户年龄预测功能以保护青少年,“成人模式”预计明年第一季度上线。
与此同时,OpenAI正积极进军企业软件市场,将自身定位为同时服务消费者与企业两大客户群体的公司。GPT-5.2在编码、法律、金融等专业领域的性能提升,正是为了吸引高价值的企业客户。
然而,在这一市场,OpenAI将直接面对谷歌、微软等巨头的激烈竞争,后者能够将AI工具与成熟的办公软件生态(如Google Workspace、Microsoft 365)深度捆绑。
营利性能够帮助OpenAI获得源源不断的资金,以继续它帮助人类的远大理想,但这个过程中也会衍生出一系列的安全、伦理方面的问题。就在GPT-5.2发布之前,OpenAI遭遇一项新的诉讼,指控ChatGPT与一名心理困扰用户的互动间接导致了康涅狄格州的一起谋杀-自杀惨剧。需要注意,这已经不是第一起类似的诉讼。
OpenAI回应称事件“令人心碎”,并承诺持续改进系统对心理困扰迹象的识别和应对能力,引导用户寻求现实帮助。此外,《纽约时报》起诉OpenAI及其合作伙伴微软侵犯版权的案件仍在进行中,凸显了AI训练数据合法性这一根本性行业难题。
这场OpenAI与谷歌之间的较量,早已超越单纯的技术参数比拼,演变为一场涵盖技术迭代、生态构建、商业模式、安全治理和资本耐力的全方位战争。
在技术层面,基准测试的“榜首”争夺日趋白热化。OpenAI研究副总裁艾丹·克拉克虽未透露GPT-5.2的具体训练突破,但承认在预训练等基础环节持续改进,回应了业界对“预训练潜力是否耗尽”的质疑。
在生态层面,OpenAI推出自有浏览器,意在挑战谷歌的Chrome,试图构建从底层模型到上层应用的完整生态闭环。而谷歌则凭借其庞大的现有产品矩阵,试图通过整合创造协同优势。
AI模型评估平台LMArena公司Wei-Lin Chiang指出:“通用模型的用户增长已触及阶段性瓶颈,下一个增长极必然来自垂直领域。”他还强调,当前竞争的核心已非单纯用户扩张,而在于谁能率先在医疗、金融等关键行业建立起可靠、高效的解决方案,真正实现技术能力向产业价值的转化。
最后在战略文化层面,OpenAI从非营利研究机构向高估值商业实体的快速转型,以及其对盈利的迫切追求,正在重塑其内部文化。一些早期员工曾引以为傲的、与谷歌等广告驱动模式的区别,正在现实压力下变得模糊。
“这是一场将在多条战线上展开的竞赛。”追踪最新AI技术性能的公司Vals AI首席执行官拉扬·克里希南的论断精准概括了当前AI霸主之争的复杂性。
总体来看,GPT-5.2的发布是OpenAI在专业领域一次有力的技术宣示,但它远非终局——没能和对手拉开差距,甚至OpenAI自己都说要到2026年1月份才能消除警报声。更重要的是,即便短期内“红色警报”可以暂时解除,但整个AI行业最高强度的竞争警报,已然长鸣。
本文由主机测评网于2026-02-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260223872.html