时隔六年,OpenAI再度推出开源语言模型!
智东西8月6日报道,今日,OpenAI终于公开了其备受瞩目的开源模型:gpt-oss-120b和gpt-oss-20b。这两款模型均采用MoE架构,与DeepSeek的多款模型类似。
此次OpenAI开源的模型一大亮点在于其高效的部署能力。gpt-oss-120b能在单个80GB GPU上高效运行,而gpt-oss-20b仅需16GB内存即可在边缘设备上运行,为端侧AI提供本地模型选择。两款模型均采用MXFP4原生量化,其中,gpt-oss-120b在H100 GPU上经过210万卡时训练而成,20b版本的训练量仅为前者的十分之一。
在多项基准测试中,gpt-oss-120b的表现与OpenAI o4-mini几乎持平,而gpt-oss-20b则与OpenAI o3-mini相似。工具使用、小样本函数调用也是其强项之一。
面向Agent场景,这两款模型已经与OpenAI的Responses API兼容,可用于Agent工作流,具备良好的指令遵循能力、网页搜索或Python代码执行等工具使用能力以及推理能力,还支持调整模型推理长度。
自2019年的GPT-2以来,OpenAI长期未开源语言模型,但曾开源过Whisper语音模型等项目。
OpenAI语言模型再度开源的消息发布后,有网友发文庆祝,但也有人质疑其开源程度不彻底,强化学习的技术细节、预训练的数据构成、数据来源等信息都未披露,让开源社区难以从中借鉴。
同时,在所有已公布的基准测试中,OpenAI都未将gpt-oss系列与DeepSeek、Qwen、Kimi等开源模型进行比较,也没有和Claude、Grok、Gemini等闭源竞争对手打擂台。
目前,已有至少14家部署平台支持了OpenAI的最新开源模型,包括Azure、Hugging Face、vLLM、Ollama、llama.cpp、LM Studio、AWS、Fireworks、Together AI、Baseten、Databricks、Vercel、Cloudflare和OpenRouter等。
在硬件方面,英伟达、AMD、Cerebras和Groq等至少4家企业宣布了对gpt-oss系列的支持,Cerebras更是将gpt-oss-120b的推理速度提升到了每秒超过3000 tokens,创下OpenAI模型的最快纪录。
目前,gpt-oss-120b和gpt-oss-20b已上线开源托管平台Hugging Face,普通用户则可以在OpenAI打造的体验网站中直接免费使用。
开源地址:
https://huggingface.co/openai/gpt-oss-120b
https://huggingface.co/openai/gpt-oss-20b
体验链接:
https://gpt-oss.com/
OpenAI开源后,已有不少网友体验了这两款模型,智东西也进行了体验。
有许多网友都表示了一个直观感受——太快了!
据智东西体验,这款模型在思考一般性问题时,仅会进行5秒左右的思考,并迅速输出结果。
同样的问题交给其他推理模型,思考过程耗时18秒。
在编程场景,gpt-oss-120b展现出一定的规划能力,会在项目开始前给出结构预览和关键技术点。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260438987.html