OpenAI再推开源语言模型：轻量化部署引领新潮流

主机测评网
科技资讯
2026-04-20
952

时隔六年，OpenAI再度推出开源语言模型！

智东西8月6日报道，今日，OpenAI终于公开了其备受瞩目的开源模型：gpt-oss-120b和gpt-oss-20b。这两款模型均采用MoE架构，与DeepSeek的多款模型类似。

此次OpenAI开源的模型一大亮点在于其高效的部署能力。gpt-oss-120b能在单个80GB GPU上高效运行，而gpt-oss-20b仅需16GB内存即可在边缘设备上运行，为端侧AI提供本地模型选择。两款模型均采用MXFP4原生量化，其中，gpt-oss-120b在H100 GPU上经过210万卡时训练而成，20b版本的训练量仅为前者的十分之一。

在多项基准测试中，gpt-oss-120b的表现与OpenAI o4-mini几乎持平，而gpt-oss-20b则与OpenAI o3-mini相似。工具使用、小样本函数调用也是其强项之一。

OpenAI再推开源语言模型：轻量化部署引领新潮流 OpenAI 开源模型轻量化部署技术细节保留第1张

面向Agent场景，这两款模型已经与OpenAI的Responses API兼容，可用于Agent工作流，具备良好的指令遵循能力、网页搜索或Python代码执行等工具使用能力以及推理能力，还支持调整模型推理长度。

自2019年的GPT-2以来，OpenAI长期未开源语言模型，但曾开源过Whisper语音模型等项目。

OpenAI语言模型再度开源的消息发布后，有网友发文庆祝，但也有人质疑其开源程度不彻底，强化学习的技术细节、预训练的数据构成、数据来源等信息都未披露，让开源社区难以从中借鉴。

同时，在所有已公布的基准测试中，OpenAI都未将gpt-oss系列与DeepSeek、Qwen、Kimi等开源模型进行比较，也没有和Claude、Grok、Gemini等闭源竞争对手打擂台。

目前，已有至少14家部署平台支持了OpenAI的最新开源模型，包括Azure、Hugging Face、vLLM、Ollama、llama.cpp、LM Studio、AWS、Fireworks、Together AI、Baseten、Databricks、Vercel、Cloudflare和OpenRouter等。

在硬件方面，英伟达、AMD、Cerebras和Groq等至少4家企业宣布了对gpt-oss系列的支持，Cerebras更是将gpt-oss-120b的推理速度提升到了每秒超过3000 tokens，创下OpenAI模型的最快纪录。

目前，gpt-oss-120b和gpt-oss-20b已上线开源托管平台Hugging Face，普通用户则可以在OpenAI打造的体验网站中直接免费使用。