当前位置:首页 > 科技资讯 > 正文

OpenAI开源新语言模型:开源时代的新篇章

终于,OpenAI 的新发布不负众望地引起了业界的高度关注。

虽然没有带来我们期待已久的 GPT-5,但这次的“something big-but-small today.”同样令人振奋。

OpenAI开源新语言模型:开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型 第1张

没错,这次带来的是开源新语言模型

要知道,这是近几年来(自 GPT-2 以来),OpenAI 首次重新开源模型。

据在 OpenAI 任职研究科学家的清华校友翁家翌透露,从 2022 年起,OpenAI 内部就不断讨论模型开源,并曾数次接近“开源”目标,但直到今天才实现。

OpenAI开源新语言模型:开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型 第2张

这次还一下开源了两个,都是推理模型。

OpenAI开源新语言模型:开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型 第3张

GitHub 地址:https://github.com/openai/gpt-oss
Hugging face 地址:https://huggingface.co/openai/gpt-oss-20b
Hugging face 地址:https://huggingface.co/openai/gpt-oss-120b
博客地址:https://openai.com/index/introducing-gpt-oss/

Sam Altman 声称,gpt-oss 性能与 o4-mini 水平相当,并且可以在高端笔记本电脑上运行(甚至还有一个较小的可以在手机上运行)。

OpenAI开源新语言模型:开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型 第4张

两款开源模型与 o3、o4-mini 的跑分结果比较如下:

OpenAI开源新语言模型:开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型 第5张

总结来说,这两个开源模型的亮点包括:

  • 宽松的 Apache 2.0 许可证:自由构建,不受版权限制或专利风险 - 非常适合实验、定制和商业部署。
  • 可调整的推理力度:根据具体用例和延迟需求轻松调整推理力度(低、中、高)。
  • 完整的思维链(CoT):完全可访问模型的推理过程,从而更轻松地进行调试并增强对输出的信任。不计划向终端用户展示。
  • 可微调:通过参数微调,完全可根据特定用例定制模型。
  • Agentic 功能:使用模型的功能进行函数调用、网页浏览、Python 代码执行和结构化输出。
  • 原生 MXFP4 量化:模型使用原生 MXFP4 精度针对 MoE 层进行训练,使得 gpt-oss-120b 可在单个 H100 GPU 上运行,gpt-oss-20b 模型可在 16GB 内存内运行。

OpenAI 还提供了一个 playground,让开发者可以在网页端简单尝试这两个开源模型,感兴趣的读者可以去体验尝试。

OpenAI开源新语言模型:开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型 第6张

试用地址:https://www.gpt-oss.com/

在过去的几个小时里,海外 AI 社区已经沸腾了,纷纷开始下载尝试新模型,以至于 Hugging Face 的 CTO 不得不在线请求大家不要都去下载,服务器要崩了!

OpenAI开源新语言模型:开源时代的新篇章 OpenAI 开源模型 GPT-OSS 语言模型 第7张