当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元

开源领域的领军者DeepSeek正式推出了V3.2版本,其在多项性能基准测试中全面超越了GPT-5 High,并与谷歌的Gemini-3.0 Pro表现出旗鼓相当的实力。该模型不仅在国际数学奥林匹克、编程竞赛等四项硬核赛事中斩获金牌级成绩,还依托创新的DSA稀疏注意力架构,成功打破了“速度、成本与智能”之间的传统不可能三角。

OpenAI此次面临了前所未有的竞争压力!

就在近日,被誉为“源神”的DeepSeek开源了其DeepSeek-V3.2正式版——

在数学、编程等多类推理基准评估中,该模型全面领先于GPT-5 High,并优于Claude 4.5 Sonet;

与近期备受关注的Gemini 3.0 Pro相比,两者难分高下,展现出了同等的卓越性能!

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元 V3.2  稀疏注意力架构 AI推理模型 开源人工智能 第1张

表1:DeepSeek-V3.2与其他主流模型在数学、代码及通用领域评测集上的得分对比(括号内为估计的Tokens消耗总量)

今年以来,DeepSeek已累计发布了7款模型——其“开源之神”的称号实至名归:

DeepSeek‑R1、DeepSeek‑R1‑Zero

DeepSeek‑V3、DeepSeek‑V3.1、DeepSeek‑V3.1-Terminus、DeepSeek‑V3.2‑Exp

DeepSeek‑OCR、DeepSeek‑Math-V2

出手即巅峰,开源四款奥赛金牌级人工智能模型

全新的DeepSeek-V3.2模型,一经推出便震撼业界。

DeepSeek正式发布了DeepSeek-V3.2与DeepSeek-V3.2-Speciale——这两款专为智能体设计的推理优先模型!

  • DeepSeek-V3.2:作为V3.2-Exp的官方迭代版本,现已全面登陆App、网页端及API接口;
  • DeepSeek-V3.2-Speciale:致力于突破推理能力边界,目前仅通过API提供服务,供专业评估与研究使用。

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元 V3.2  稀疏注意力架构 AI推理模型 开源人工智能 第2张

两款模型均实现了世界级的推理性能:

  • V3.2:在推理能力与文本长度处理上取得平衡,具备GPT-5级别的性能表现,适合日常应用驱动;
  • V3.2-Speciale:追求极致推理能力,已取得四项金牌级成就;目前仅提供API版本(暂不支持工具调用),以支持社区深度评估与前沿研究。

在主流推理基准测试中,DeepSeek-V3.2-Speciale的性能与Gemini-3.0-Pro媲美(详见表1)。

更为引人注目的是,V3.2-Speciale 模型成功斩获了多项国际竞赛金牌:

  • IMO 2025(国际数学奥林匹克)
  • CMO 2025(中国数学奥林匹克)
  • ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)
  • IOI 2025(国际信息学奥林匹克)

其中,在ICPC与IOI竞赛中,其成绩分别达到了人类选手第二名与第十名的水平。

而DeepSeek-V3.2是首个将思考过程直接整合到工具使用中的模型,同时支持在思考模式和非思考模式下灵活调用工具。

目前,这两款模型均已全面开源:

· DeepSeek-V3.2

HuggingFace:https://huggingface.co/deepseek-ai/

DeepSeek-V3.2

ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

· DeepSeek-V3.2-Speciale

HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

从“引擎验证”到“全能车手”:DeepSeek V3.2的进化之路

如果将两个月前发布的DeepSeek-V3.2-Exp比作一台在赛道上呼啸而过的“概念车”,旨在向世界证明“稀疏注意力”引擎的动力潜力;

那么今天正式转正的DeepSeek V3.2,则是一辆完成了内饰精修、装配了顶级导航系统、可以随时上路解决复杂问题的“量产超跑”。

这就是DeepSeek V3.2相比于Exp版(实验版)最核心的进化逻辑:核心引擎保持不变,但驾驶技巧(即Agent能力)实现了质的飞跃。

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元 V3.2  稀疏注意力架构 AI推理模型 开源人工智能 第3张

V3.2正式版 vs. Exp:实现了“边干边想”的智能化突破

在架构层面,V3.2沿用了Exp版本验证成功的DSA架构,但在“软实力”上,DeepSeek解决了一个长期困扰AI界的难题——思考与行动之间的断裂问题

在V3.2-Exp时期(以及其他大多数推理模型),模型类似于一个记忆短暂的老学究:它会先花费大量时间进行思考,决定调用某个工具(例如查询天气)。

但当工具返回“今天是雨天”的结果时,它往往会“断片”,忘记刚才思考到了哪一步,从而不得不重新规划。

V3.2正式版引入了“思维上下文管理”机制。

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元 V3.2  稀疏注意力架构 AI推理模型 开源人工智能 第4张

这就像为模型安装了一个“工作记忆暂存区”。

现在的V3.2如同一位经验丰富的外科医生,在伸手索取手术刀(调用工具)的间隙,脑海中的手术方案依然清晰连贯,拿到刀具后能无缝衔接下一步操作。

为了练就这项高超技能,DeepSeek甚至为V3.2搭建了一个“虚拟演练场”。

团队合成了超过1800个虚拟的操作系统、代码库和浏览器环境,生成了8.5万条极其复杂的指令,迫使V3.2在虚拟世界中反复练习“修复Bug”、“查询资料”、“生成报表”等任务。

正是这种高强度的专项训练,让V3.2正式版从一个仅擅长解题的“做题家”,进化成了能熟练运用工具解决实际问题的“实干家”。

最大技术亮点:为注意力机制装上“闪电索引器”

V3.2能够同时兼顾“智能”与“经济性”,其最大的功臣依然是名为稀疏注意力(DSA)的底层创新技术。

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元 V3.2  稀疏注意力架构 AI推理模型 开源人工智能 第5张

DeepSeek-V3.2的注意力架构图解

要理解其卓越之处,我们需先审视传统模型的局限性。

传统模型在处理长文档时,就像一位强迫症晚期的图书管理员:

为了回答一个简单的问题,它强迫自己必须将图书馆中每一本书的每一页、每一行文字都阅读一遍,并计算它们之间的关联性。

这导致计算量随着文档长度的增加呈指数级爆炸(O(L^2))。

DSA技术则为这位管理员配备了一套“闪电索引器”。

当问题输入时,DSA先以极低的成本快速扫描“索引”,瞬间判断出哪些页面可能包含答案,并将无关的99%的内容直接过滤掉。

随后,它仅对筛选出的1%关键内容进行精细化的深度阅读与分析。

这种“查阅目录”而非“死磕全书”的策略,将计算复杂度从可怕的指数级直接降低至近乎线性(O(L))。

带来的显著提升:打破“不可能三角”的束缚

DSA技术的成功应用,直接突破了AI领域长期存在的“速度、成本、智能”不可能三角。

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元 V3.2  稀疏注意力架构 AI推理模型 开源人工智能 第6张

首先,成本大幅降低,长文本处理无忧。

对于用户而言,向模型输入一部数十万字的小说或庞大代码库,不再是一项“烧钱”的奢侈行为,处理速度也从“等待泡一杯咖啡”缩短至“眨眼之间”。

其次,算力盈余催生了“智力涌现”,这是最令人振奋的一点。

正因为DSA节省了大量算力资源,DeepSeek才有信心推出性能卓越的Speciale版本。

既然读取速度更快,那就允许它进行更长时间的深度思考!

Speciale版本利用节省下来的算力资源,执行更深入的“长思考”和复杂逻辑推演。

结果令人震撼:DeepSeek-V3.2-Speciale在数学(IMO金牌)、编程(IOI金牌)等硬核指标上,不仅超越了GPT-5 High,更是与谷歌最强的Gemini 3.0 Pro平分秋色。

DeepSeek V3.2正式版发布:开源AI模型性能全面突破,引领智能推理新纪元 V3.2  稀疏注意力架构 AI推理模型 开源人工智能 第7张

从验证DSA引擎潜力的V3.2-Exp,到集成Agent能力、思维上下文管理、虚拟演练场训练于一体的V3.2正式版,DeepSeek展示了一条通往强智能的新路径:在算力受限的背景下,通过更智能的架构设计、更精细的训练方法和更开放的生态体系,撬动推理能力的极限。

DeepSeek-V3.2的横空出世,标志着DeepSeek开源AI的辉煌时刻:摒弃无脑的规模扩张,依托更精巧的算法创新,在算力的狭缝中开辟出一条通往巅峰的捷径。

参考资料

DeepSeek V3.2 正式版:强化 Agent 能力,深度融合思考推理