当前位置:首页 > 科技资讯 > 正文

AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战

划重点:

1、OpenAI 官宣GPT5发布会将于北京时间周五凌晨1点开始,目前推出三个版本:GPT-5、GPT-5-mini、GPT-5-nano。在发布会前夜,OpenAI的两大竞争对手——谷歌DeepMind与Anthropic,先后发布重磅新品,加剧了AI竞争的激烈程度。

2、三个半小时内,谷歌DeepMind发布Genie 3、Anthoric发布Claude Opus 4.1、OpenAI开源2个推理模型。其中,谷歌Genie 3凭借“世界模拟器”功能成为焦点,被认为是通往AGI的关键一步。

3、OpenAI时隔6年再度开源,推出了两个性能接近其闭源SOTA模型的gpt-oss,此举有助于在开源社区中重建领导地位。可以确信的是,GPT-5是新战局的开始,而非结束。

OpenAI 官宣:LIVE STREAM(直播)将于周四上午10点(太平洋时间),即北京时间周五凌晨1点开始。并且,从官网可以看到GPT-5的图标已经确认。目前提供三个版本:GPT-5、GPT-5-mini、GPT-5-nano。

发布会前夕,OpenAI的两家竞争对手——谷歌DeepMind和Anthropic,分别发布了他们的新品,进一步加剧了AI竞争的激烈程度。

北京时间8月5日晚10:03至8月6日1:26期间,硅谷上演了一场长达3小时23分钟的AI版《三国杀》。

谷歌率先以“世界模拟器”Genie 3一骑绝尘,生成了可交互的3D世界。

Anthoric紧随其后,发布了最新的Claude Opus 4.1,直接夺得了最强AI编程的宝座。

虽然还未见到GPT-5的身影,但OpenAI通过时隔6年的再次开源吸引了大量关注,一口气开源了两个推理模型,性能接近o4-mini。

AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战 OpenAI GPT-5 谷歌DeepMind Anthropic 第1张

从世界模型到变成模型,再到开源的推理模型,这三个AI大模型玩家在短短一晚内的交锋,无疑吊足了全球科技圈的胃口。

那么随之而来的问题是,这场AI版的《三国杀》,到底谁才是最大赢家?我们这就来仔细分析。

新一代通用世界模型Genie 3:一句话生成可交互3D世界

谷歌DeepMind发布的Genie 3,最大的亮点在于能够用一句话生成逼真的3D世界。例如:

AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战 OpenAI GPT-5 谷歌DeepMind Anthropic 第2张

结果显示,Genie 3支持的画质可达720p、每秒24帧、实时可导航;并且可以在保证一致性的情况下实现分钟级生成。

AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战 OpenAI GPT-5 谷歌DeepMind Anthropic 第3张

网友认为Genie 3的效果尤为惊艳。例如,在时长和画质方面,Genie 3的表现明显优于Genie 2。Genie 3不仅画质更高清,而且当Genie 2结束交互时,Genie 3仍能长时间保持交互。

AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战 OpenAI GPT-5 谷歌DeepMind Anthropic 第4张

此外,DeepMind表示Genie 3将推动具身智能的发展。为了测试Genie 3所创建的世界是否适合用于训练智能体,DeepMind生成了一些世界并尝试在其中训练通用型3D虚拟环境智能体SIMA。

Claude Opus 4.1:AI编程SOTA新王诞生

在Genie 3之后,Anthoric发布了Claude Opus 4.1,一举拿下AI编程的SOTA。与OpenAI的o3和Gemini 2.5 Pro相比,它在多项基准测试中领先。

AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战 OpenAI GPT-5 谷歌DeepMind Anthropic 第5张

Claude Opus 4.1在编程能力上尤为突出。在SWE-bench上,其性能提升至74.5%,超越Opus 4、Gemini 2.5 Pro和o3。

AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战 OpenAI GPT-5 谷歌DeepMind Anthropic 第6张

有网友已经进行了实测。从变成效果来看,Claude Opus 4.1是最符合物理效果的一个。因此有网友呼吁“选AI编程模型还需选靠谱的”,这也暗示了Opus 4.1性能的强劲。

时隔6年OpenAI再度开源:GPT-oss双模型亮相

最后登场的OpenAI的发布更具时代意义。上一次OpenAI的“open”还是在2019年的GPT-2。这次它一口气开源了两款大模型:

  • gpt-oss-120b: 拥有117亿参数,采用MoE架构,实际运行时激活的参数约为5亿。它可以在一张8GB显存的GPU上运行。
  • gpt-oss-20b: 拥有约2亿参数,同样采用MoE架构,激活参数约为亿。它可以在仅有内存的消费级设备上运行。
从评测结果来看,gpt-oss的性能已接近闭源的o4-mini模型;而gpt-oss的性能则接近o3-mini。 更多具体评测数据请见:AI三国杀:OpenAI、谷歌DeepMind与Anthropic激战 OpenAI GPT-5 谷歌DeepMind Anthropic 第7张... ... ... ...