当前位置:首页 > 科技资讯 > 正文

OpenAI再推开源语言模型:轻量化部署引领新潮流

时隔六年,OpenAI再度推出开源语言模型!

智东西8月6日报道,今日,OpenAI终于公开了其备受瞩目的开源模型:gpt-oss-120b和gpt-oss-20b。这两款模型均采用MoE架构,与DeepSeek的多款模型类似。

此次OpenAI开源的模型一大亮点在于其高效的部署能力。gpt-oss-120b能在单个80GB GPU上高效运行,而gpt-oss-20b仅需16GB内存即可在边缘设备上运行,为端侧AI提供本地模型选择。两款模型均采用MXFP4原生量化,其中,gpt-oss-120b在H100 GPU上经过210万卡时训练而成,20b版本的训练量仅为前者的十分之一。

在多项基准测试中,gpt-oss-120b的表现与OpenAI o4-mini几乎持平,而gpt-oss-20b则与OpenAI o3-mini相似。工具使用、小样本函数调用也是其强项之一。

OpenAI再推开源语言模型:轻量化部署引领新潮流 OpenAI 开源模型 轻量化部署 技术细节保留 第1张

面向Agent场景,这两款模型已经与OpenAI的Responses API兼容,可用于Agent工作流,具备良好的指令遵循能力、网页搜索或Python代码执行等工具使用能力以及推理能力,还支持调整模型推理长度。

自2019年的GPT-2以来,OpenAI长期未开源语言模型,但曾开源过Whisper语音模型等项目。

OpenAI语言模型再度开源的消息发布后,有网友发文庆祝,但也有人质疑其开源程度不彻底,强化学习的技术细节、预训练的数据构成、数据来源等信息都未披露,让开源社区难以从中借鉴。

同时,在所有已公布的基准测试中,OpenAI都未将gpt-oss系列与DeepSeek、Qwen、Kimi等开源模型进行比较,也没有和Claude、Grok、Gemini等闭源竞争对手打擂台

目前,已有至少14家部署平台支持了OpenAI的最新开源模型,包括Azure、Hugging Face、vLLM、Ollama、llama.cpp、LM Studio、AWS、Fireworks、Together AI、Baseten、Databricks、Vercel、Cloudflare和OpenRouter等。

在硬件方面,英伟达、AMD、Cerebras和Groq等至少4家企业宣布了对gpt-oss系列的支持,Cerebras更是将gpt-oss-120b的推理速度提升到了每秒超过3000 tokens,创下OpenAI模型的最快纪录。

目前,gpt-oss-120b和gpt-oss-20b已上线开源托管平台Hugging Face,普通用户则可以在OpenAI打造的体验网站中直接免费使用。

开源地址:

https://huggingface.co/openai/gpt-oss-120b

https://huggingface.co/openai/gpt-oss-20b

体验链接:

https://gpt-oss.com/

推理速度成核心亮点,网友质疑未与DeepSeek、Qwen对比

OpenAI开源后,已有不少网友体验了这两款模型,智东西也进行了体验。

有许多网友都表示了一个直观感受——太快了!

OpenAI再推开源语言模型:轻量化部署引领新潮流 OpenAI 开源模型 轻量化部署 技术细节保留 第2张

据智东西体验,这款模型在思考一般性问题时,仅会进行5秒左右的思考,并迅速输出结果。

OpenAI再推开源语言模型:轻量化部署引领新潮流 OpenAI 开源模型 轻量化部署 技术细节保留 第3张

同样的问题交给其他推理模型,思考过程耗时18秒。

OpenAI再推开源语言模型:轻量化部署引领新潮流 OpenAI 开源模型 轻量化部署 技术细节保留 第4张

在编程场景,gpt-oss-120b展现出一定的规划能力,会在项目开始前给出结构预览和关键技术点。

OpenAI再推开源语言模型:轻量化部署引领新潮流 OpenAI 开源模型 轻量化部署 技术细节保留 第5张