2025年8月19日,DeepSeek在Hugging Face平台正式开源新一代大模型DeepSeek-V3.1,并于8月21日面向全球开发者发布完整版本。DeepSeek-V3.1的推出标志着智能体时代的新一步,通过Post-Training优化,显著提升工具使用与智能体任务能力,同时宣布API价格调整及国产芯片深度适配方案,引发行业震动。
更强大的记忆能力:新一代模型处理能力提升至128K,可处理相当于30万汉字的长文本,为长文档分析、复杂代码生成和深度多轮对话提供了巨大支持。这一升级使得模型在工具调用、函数执行及复杂推理任务中的表现提升约40%。
架构设计升级,支持智能体调试和优化:DeepSeek-V3.1实现了从单一推理模式向双模式架构的升级。新的API体系支持DeepSeek-Chat(非思考模式)和DeepSeek-Reasoner(思考模式),满足不同场景需求。
更强大的工具调用能力,使智能体更可靠地与企业内部交互:新增strict模式支持,严格保证输出格式符合开发者预定义的参数schema,极大减少了格式错误或参数缺失问题。
DeepSeek-V3.1使用UE8M0 FP8 Scale参数精度格式,专为即将发布的下一代国产芯片设计。
UE8M0 FP8是MXFP8路径里的“缩放因子”,FP8是用8位二进制数表示浮点数。相比传统FP32或FP16,FP8显著降低了显存占用和计算资源需求,同时维持了较高的精度。
受益显著的是国产AI芯片厂商,如寒武纪、华为昇腾等。长期来看,这些厂商借助DeepSeek-V3.1提升国际竞争力,扩大应用生态。短期内,市场反应明显:寒武纪股价大涨20%,总市值跃居科创板头名。
另一方面,这一技术进展也为部分企业带来挑战:
第一类是国际闭源模型厂商(如OpenAI、Anthropic),这些厂商将面临更大幅度的开源竞争压力。
第二类是其他开源模型提供商(如Meta、Mistral AI),DeepSeek在模型优化与量化方面设立更高基准,技术竞争壁垒提高。
DeepSeek-V3.1采用Apache 2.0许可证,允许免费商用及修改,显著降低企业部署和研发门槛。这种开放策略与OpenAI的“有限开源”和API闭源商业模式形成鲜明对比。
DeepSeek-V3.1的全面开源,尤其让以下几类公司显著受益:
第一类是应用层和智能体开发公司:所有基于大模型构建应用的初创公司和开发者都是受益者。他们的模型成本大幅下降,利润空间增加。
第二类是云计算和硬件厂商:开源模型的繁荣意味着对GPU算力的需求持续增长。
第三类是拥有数据和应用场景的传统企业:制造业、金融业、教育业等公司能够以更低成本、更安全地利用DeepSeek-V3.1开发内部AI智能体。
本文由主机测评网于2026-04-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260439987.html