OpenAI开源新语言模型：开源时代的新篇章

终于，OpenAI 的新发布不负众望地引起了业界的高度关注。

虽然没有带来我们期待已久的 GPT-5，但这次的“something big-but-small today.”同样令人振奋。

OpenAI开源新语言模型：开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型第1张

没错，这次带来的是开源新语言模型。

要知道，这是近几年来（自 GPT-2 以来），OpenAI 首次重新开源模型。

据在 OpenAI 任职研究科学家的清华校友翁家翌透露，从 2022 年起，OpenAI 内部就不断讨论模型开源，并曾数次接近“开源”目标，但直到今天才实现。

OpenAI开源新语言模型：开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型第2张

这次还一下开源了两个，都是推理模型。

OpenAI开源新语言模型：开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型第3张

GitHub 地址：https://github.com/openai/gpt-oss
Hugging face 地址：https://huggingface.co/openai/gpt-oss-20b
Hugging face 地址：https://huggingface.co/openai/gpt-oss-120b
博客地址：https://openai.com/index/introducing-gpt-oss/

Sam Altman 声称，gpt-oss 性能与 o4-mini 水平相当，并且可以在高端笔记本电脑上运行（甚至还有一个较小的可以在手机上运行）。

OpenAI开源新语言模型：开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型第4张

两款开源模型与 o3、o4-mini 的跑分结果比较如下：

OpenAI开源新语言模型：开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型第5张

总结来说，这两个开源模型的亮点包括：

宽松的 Apache 2.0 许可证：自由构建，不受版权限制或专利风险 - 非常适合实验、定制和商业部署。
可调整的推理力度：根据具体用例和延迟需求轻松调整推理力度（低、中、高）。
完整的思维链（CoT）：完全可访问模型的推理过程，从而更轻松地进行调试并增强对输出的信任。不计划向终端用户展示。
可微调：通过参数微调，完全可根据特定用例定制模型。
Agentic 功能：使用模型的功能进行函数调用、网页浏览、Python 代码执行和结构化输出。
原生 MXFP4 量化：模型使用原生 MXFP4 精度针对 MoE 层进行训练，使得 gpt-oss-120b 可在单个 H100 GPU 上运行，gpt-oss-20b 模型可在 16GB 内存内运行。

OpenAI 还提供了一个 playground，让开发者可以在网页端简单尝试这两个开源模型，感兴趣的读者可以去体验尝试。

OpenAI开源新语言模型：开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型第6张