当前位置：首页 > 科技资讯 > 正文

2025WAIC揭示大模型产业三大趋势：推理模型、应用落地、国产算力

主机测评网
科技资讯
2026-04-19
676

7月末，上海世博展览馆迎来了2025WAIC的盛况，吸引了无数科技爱好者。

在这场科技盛宴背后，2025年以来，国内大模型产业的三大趋势愈发清晰，竞争版图正在重塑：

推理模型成为新的技术制高点；应用落地从概念走向实战；国产算力迎来突破性进展。

从DeepSeek的开源风暴到华为昇腾384超节点的首次亮相，从“六小虎”的差异化布局到巨头的全面反击，大模型正告别“百模大战”的混沌期，步入更加理性而激烈的“中场战事”。

2025WAIC揭示大模型产业三大趋势：推理模型、应用落地、国产算力大模型推理模型应用落地国产算力第1张

在2025 WAIC上，原本低调的机器人产业变得火热，相关公司数量从2024年的18家剧增到80家，占据了几乎整个展馆二层H3展馆。而大模型厂商们则主要集中在一层H1展馆。

今年，“AI六小虎”中的零一万物、百川智能并未现身，BAT、科大讯飞等头部厂商展位不再专注比拼模型参数，而是展示出多样的落地生态。

如今，大模型竞争已不再是单纯的技术军备竞赛，而是一场关乎产业生态、商业模式和国际竞争力的综合较量。当大模型从实验室走向产业一线，推理能力成为新的分水岭，国产化成为不可逆转的趋势，每一个参与者都在重新审视自己的定位和实力。

一场推理模型的“百花齐放”

如果说2025年以前的“百模大战”更多是在基础能力上的比拼，那么推理模型则代表了从“能回答”到“会思考”的质的飞跃。

这一转折点的标志性事件无疑是DeepSeek-R1的横空出世。

据业内分析，DeepSeek-R1的训练成本仅为560万美元，远低于美国AI公司的数千万美元乃至数亿美元投入。更重要的是，这一技术突破开启了推理模型的“平民化”路径，让原本高不可攀的AGI研究变得相对可及。

面对变局，头部厂商迅速跟进。WAIC上推理模型的“百花齐放”，阐释着大模型竞争规则的变化。

据不完全统计，自2025年1月DeepSeek-R1发布以来，头部厂商和大模型创业公司在短短数月内相继推出了自己的推理模型。

3月，腾讯发布混元T1正式版，百度发布文心X1；阿里发布QwQ-32B推理模型；

4月，字节发布Seed-Thinking-v1.5；阿里发布通义千问Qwen3推理模型；

6月，腾讯发布混元-A13B；

7月，智谱发布GLM-4.5，阶跃星辰发布Step3，科大讯飞星火X1迎来第二次升级，月之暗面发布Kimi K2。

2025WAIC揭示大模型产业三大趋势：推理模型、应用落地、国产算力大模型推理模型应用落地国产算力第2张

WAIC前后，国内大模型厂商展示自家最新推理模型，呈现出在技术路线上明显的差异化策略，主要体现在模型架构、推理机制、参数策略及成本三方面：

首先是架构选择、创新的分野。大模型架构从纯Transformer走向混合架构时代，单一架构已无法满足推理模型的性能需求，混合架构成为新的技术制高点。

腾讯的混元T1正式版摒弃纯Transformer架构，转而将混合Mamba架构应用于推理大模型；月之暗面的Kimi K2、阿里的Qwen3推理模型、字节的Seed-Thinking-v1.5、智谱的GLM-4.5、阶跃星辰的Step3均采用MoE架构。

其次是推理机制创新，更适合场景应用以及Agent发展。

百度的文心X1采用“思维链-行动链”协同训练；科大讯飞的星火X1使用“快思考+慢思考”统一模型架构；月之暗面的Kimi2主打代码能力和Agentic任务处理；阶跃星辰的Step3创新引入MFA注意力机制和AFD分布式推理系统；智谱的GLM-4.5首次在单个模型中实现推理、编码和智能体能力的原生融合。

最后是参数策略的强调，在效率、成本、速度之间寻找平衡。

Kimi K2拥有32B激活参数和1T总参数；Seed-Thinking-v1.5参数量降低至200B总参数和20B激活参数；阿里QwQ-32B采用32B参数规模；腾讯混元A13B总参数80B、激活参数仅13B。