小米发布MiMo-V2-Flash AI模型，强化Agent能力与端侧智能布局

主机测评网
科技资讯
2026-02-10
198

自年初传出与雷军接触并离职的消息，到上个月官方宣布加入小米，再到本月出席小米“人车家全生态大会”，被称为“天才少女”的罗福莉，在台上正式推出了全新模型MiMo-V2-Flash。

作为AI领域的后来者，小米此次呈现了一份令人瞩目的成果单。

这是一个参数达309B、激活参数仅15B的“大”模型（罗福莉本人指出，其尺寸小到不愿称其为大模型），在小米团队的规划中，该模型专为Agent基座训练而设计。

为此，模型的优化重点聚焦于特定方向，核心在于高性价比与速度：

例如，它能实现每秒150 tokens的生成速度，成本极低，在保持高性价比的同时，确保了模型性能的稳定。

“它的代码能力和Agent能力在全球公开公正的评估榜单上，已跻身开源模型Top 1-2行列。”罗福莉表示，“大部分评估基准已超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型持平，但参数规模仅为后者的一半到三分之一。”

小米发布MiMo-V2-Flash AI模型，强化Agent能力与端侧智能布局小米 MiMo-V2-Flash Agent 端侧部署第1张

小米新模型发布后，口碑呈现两极分化：有人赞扬其代码能力领先，有人则认为这是“刷分”之作。

无论如何，AI已成为小米不可或缺的一环。

选择在12月18日的人车家全生态大会亮相，进一步凸显了AI对小米的战略重要性。

在智能终端方面，小米面临两大任务：第一，通过轻量化模型和端侧部署，升级“超级小爱”与澎湃OS，将AI深度集成到终端；第二，在智能驾驶领域，小米需以大模型为基座，为智驾能力拓展空间。

在AI布局上，小米以实际行动表明其“动真格”的决心。

降成本、提速度，小米全力押注Agent

小米的AI目标，早在2023年雷军的年度演讲中就已明确——“轻量化+端侧部署”。

罗福莉在演讲中坦言，当前模型学习方向与生物智能进化路径存在偏差，单纯依赖“规模效应”已难以催生更高阶智能。

随着Scaling Law带来的增益递减，小米选择了一条更贴合自身优势的路径：打造参数小、性能优且成本低的模型。

“Scaling范式正从预训练（Pre-train）转向后训练（Post-train），”罗福莉解释道，“要激发后训练潜力，需建立稳定范式，以便在强化学习（RL）上投入更多算力。”

作为Agent基座模型，MiMo-V2-Flash的优化逻辑围绕三个核心问题展开：

高效沟通：强化代码能力与工具调用，奠定智能体交互基础。

加速带宽：通过高推理效率，破解智能体间信息传递瓶颈。

发力后训练：依托稳定范式，释放强化学习潜能。

小米发布MiMo-V2-Flash AI模型，强化Agent能力与端侧智能布局小米 MiMo-V2-Flash Agent 端侧部署第2张

由此，小米推出了309B的MiMo-V2-Flash模型，从指标看，其最突出优势在于代码能力。

官方数据显示，在SWE-Bench Multilingual（软件工程多语言基准测试）中，该模型甚至超越了包括GPT-5在内的多个闭源大模型。

尽管在其他指标上，与DeepSeek V3.2、kimi k2 Thinging等开源模型尚有细微差距，但作为小尺寸模型，表现已相当出色。

更关键的是该模型在推理速度与成本上的优化：

以Claude Sonnet 4.5为参照，小米新模型的推理成本仅为前者的2.5%，生成速度却达到其2倍。

MiMo-V2-Flash的API定价为输入0.7元/百万tokens、输出2.1元/百万tokens，在国内模型中极具价格竞争力。

小米发布MiMo-V2-Flash AI模型，强化Agent能力与端侧智能布局小米 MiMo-V2-Flash Agent 端侧部署第3张

为优化成本、提升推理速度，小米披露了其技术架构选择——混合注意力机制。

在混合注意力机制上，月之暗面、MiniMax等企业也曾进行类似探索。

小米采用了5:1的滑动窗口注意力（SWA）与全局注意力（GA）混合结构。

官方实验显示，SWA在长文本和推理能力上优于主流线性注意力机制，且固定大小的KV Cache易于适配现有基础设施。

然而，对小米而言，若要将模型接入车载、手机等设备，300B参数规模仍较大，端侧落地尚存距离。

最引人深思的，或许是罗福莉的结语：

“AI进化的下一阶段，必须拥有能与真实环境交互的物理模型，”罗福莉强调，“我们本质上不是在打造程序，而是构建一个具物理一致性、时空连贯性的虚拟宇宙。”

从小米今年的模型发布节奏看，未来优化将分两条线推进：一是深耕端侧，为智能终端赋能；二是攻克物理模型，补强智驾模型能力。

布局端侧与智驾，AI夯实小米生态基石

无论外界对参数与架构的讨论多么激烈，对小米来说，AI价值终须回归业务。

选在人车家全生态大会发布模型，本身即彰显AI对小米的战略意义：

在智能终端侧，通过升级“超级小爱”与澎湃OS，使其从指令执行者蜕变为真正助理；在智能驾驶侧，则亟需大模型基座，以拓展智驾能力上限。

回顾2025年，小米在MiMo系列上的推进呈现急行军态势，与两年前的沉寂形成鲜明对比。

4月：开源MiMo-7B系列，涵盖基础、指令微调及强化学习版本。

5月：发布MiMo-VL-7B，实现多模态视觉理解突破。

11月：推出MiMo-Embodied具身智能大模型，整合自动驾驶与机器人技术。

12月：MiMo-V2-Flash压轴登场，主打极致效率与Agent能力。

这一系列动作背后，是巨额资金投入。小米集团总裁卢伟冰在财报电话会中明确，AI是核心研发方向。2025年，小米研发投入预计超300亿元，其中约75亿元直接投向AI领域，并计划未来五年投入超2000亿元。

“在端侧，我们追求轻量算力、低功耗与周期成本，以普及端侧AI，”卢伟冰表示，“这将是小米未来重要方向，也是其优势所在。”

组织层面动作同样印证小米决心：从2024年起，小米自建AI Infra平台；去年底，界面新闻报道称，小米正筹建GPU万卡集群，大力投入AI大模型。据悉，其团队成立时已拥有6500张GPU资源。

为支撑战略，小米人才版图在2025年日趋完善。

除负责基础大模型的罗福莉外，小米还引入陈龙强化智驾团队。这种“双核”配置已在技术路径上见效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身（X-Embodied）基座模型MiMo-Embodied。

小米发布MiMo-V2-Flash AI模型，强化Agent能力与端侧智能布局小米 MiMo-V2-Flash Agent 端侧部署第4张

该模型旨在解决自动驾驶与机器人间的知识迁移难题，意味着小米正尝试以通用AI逻辑驱动其庞大硬件生态——从手机到智能家居，再到智驾系统。

雷军曾提及，小米AI战略是“轻量化+本地部署”。可见，小米必将利用全球超10亿台设备的存量优势，依托AI拓展业务。

对小米而言，MiMo-V2-Flash的发布不止为抢占榜单席位，更是向资本市场与用户讲述新故事：

一家硬件巨头，正通过掌控高效“大脑”（AI模型）与广泛“身体”（人车家生态），力图在智能时代实现全面进化。

这个故事能否成真，不仅取决于模型性能，更关乎技术能否融入每一台小米设备，转化为用户可感知的体验。

免费服务器免费vps

本文由主机测评网于2026-02-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://vpshk.cn/20260224518.html

小米发布MiMo-V2-Flash AI模型，强化Agent能力与端侧智能布局

降成本、提速度，小米全力押注Agent

布局端侧与智驾，AI夯实小米生态基石

Ubuntu24.04与5060ti显卡深度学习环境配置全攻略

鸿蒙系统全面解析（HarmonyOS知识总结与入门教程）

小米发布MiMo-V2-Flash AI模型，强化Agent能力与端侧智能布局

降成本、提速度，小米全力押注Agent

布局端侧与智驾，AI夯实小米生态基石

Ubuntu24.04与5060ti显卡深度学习环境配置全攻略

鸿蒙系统全面解析（HarmonyOS知识总结与入门教程）

相关文章