自年初传出与雷军接触并离职的消息,到上个月官方宣布加入小米,再到本月出席小米“人车家全生态大会”,被称为“天才少女”的罗福莉,在台上正式推出了全新模型MiMo-V2-Flash。
作为AI领域的后来者,小米此次呈现了一份令人瞩目的成果单。
这是一个参数达309B、激活参数仅15B的“大”模型(罗福莉本人指出,其尺寸小到不愿称其为大模型),在小米团队的规划中,该模型专为Agent基座训练而设计。
为此,模型的优化重点聚焦于特定方向,核心在于高性价比与速度:
例如,它能实现每秒150 tokens的生成速度,成本极低,在保持高性价比的同时,确保了模型性能的稳定。
“它的代码能力和Agent能力在全球公开公正的评估榜单上,已跻身开源模型Top 1-2行列。”罗福莉表示,“大部分评估基准已超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型持平,但参数规模仅为后者的一半到三分之一。”
小米新模型发布后,口碑呈现两极分化:有人赞扬其代码能力领先,有人则认为这是“刷分”之作。
无论如何,AI已成为小米不可或缺的一环。
选择在12月18日的人车家全生态大会亮相,进一步凸显了AI对小米的战略重要性。
在智能终端方面,小米面临两大任务:第一,通过轻量化模型和端侧部署,升级“超级小爱”与澎湃OS,将AI深度集成到终端;第二,在智能驾驶领域,小米需以大模型为基座,为智驾能力拓展空间。
在AI布局上,小米以实际行动表明其“动真格”的决心。
小米的AI目标,早在2023年雷军的年度演讲中就已明确——“轻量化+端侧部署”。
罗福莉在演讲中坦言,当前模型学习方向与生物智能进化路径存在偏差,单纯依赖“规模效应”已难以催生更高阶智能。
随着Scaling Law带来的增益递减,小米选择了一条更贴合自身优势的路径:打造参数小、性能优且成本低的模型。
“Scaling范式正从预训练(Pre-train)转向后训练(Post-train),”罗福莉解释道,“要激发后训练潜力,需建立稳定范式,以便在强化学习(RL)上投入更多算力。”
作为Agent基座模型,MiMo-V2-Flash的优化逻辑围绕三个核心问题展开:
高效沟通:强化代码能力与工具调用,奠定智能体交互基础。
加速带宽:通过高推理效率,破解智能体间信息传递瓶颈。
发力后训练:依托稳定范式,释放强化学习潜能。
由此,小米推出了309B的MiMo-V2-Flash模型,从指标看,其最突出优势在于代码能力。
官方数据显示,在SWE-Bench Multilingual(软件工程多语言基准测试)中,该模型甚至超越了包括GPT-5在内的多个闭源大模型。
尽管在其他指标上,与DeepSeek V3.2、kimi k2 Thinging等开源模型尚有细微差距,但作为小尺寸模型,表现已相当出色。
更关键的是该模型在推理速度与成本上的优化:
以Claude Sonnet 4.5为参照,小米新模型的推理成本仅为前者的2.5%,生成速度却达到其2倍。
MiMo-V2-Flash的API定价为输入0.7元/百万tokens、输出2.1元/百万tokens,在国内模型中极具价格竞争力。
为优化成本、提升推理速度,小米披露了其技术架构选择——混合注意力机制。
在混合注意力机制上,月之暗面、MiniMax等企业也曾进行类似探索。
小米采用了5:1的滑动窗口注意力(SWA)与全局注意力(GA)混合结构。
官方实验显示,SWA在长文本和推理能力上优于主流线性注意力机制,且固定大小的KV Cache易于适配现有基础设施。
然而,对小米而言,若要将模型接入车载、手机等设备,300B参数规模仍较大,端侧落地尚存距离。
最引人深思的,或许是罗福莉的结语:
“AI进化的下一阶段,必须拥有能与真实环境交互的物理模型,”罗福莉强调,“我们本质上不是在打造程序,而是构建一个具物理一致性、时空连贯性的虚拟宇宙。”
从小米今年的模型发布节奏看,未来优化将分两条线推进:一是深耕端侧,为智能终端赋能;二是攻克物理模型,补强智驾模型能力。
无论外界对参数与架构的讨论多么激烈,对小米来说,AI价值终须回归业务。
选在人车家全生态大会发布模型,本身即彰显AI对小米的战略意义:
在智能终端侧,通过升级“超级小爱”与澎湃OS,使其从指令执行者蜕变为真正助理;在智能驾驶侧,则亟需大模型基座,以拓展智驾能力上限。
回顾2025年,小米在MiMo系列上的推进呈现急行军态势,与两年前的沉寂形成鲜明对比。
4月:开源MiMo-7B系列,涵盖基础、指令微调及强化学习版本。
5月:发布MiMo-VL-7B,实现多模态视觉理解突破。
11月:推出MiMo-Embodied具身智能大模型,整合自动驾驶与机器人技术。
12月:MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。
这一系列动作背后,是巨额资金投入。小米集团总裁卢伟冰在财报电话会中明确,AI是核心研发方向。2025年,小米研发投入预计超300亿元,其中约75亿元直接投向AI领域,并计划未来五年投入超2000亿元。
“在端侧,我们追求轻量算力、低功耗与周期成本,以普及端侧AI,”卢伟冰表示,“这将是小米未来重要方向,也是其优势所在。”
组织层面动作同样印证小米决心:从2024年起,小米自建AI Infra平台;去年底,界面新闻报道称,小米正筹建GPU万卡集群,大力投入AI大模型。据悉,其团队成立时已拥有6500张GPU资源。
为支撑战略,小米人才版图在2025年日趋完善。
除负责基础大模型的罗福莉外,小米还引入陈龙强化智驾团队。这种“双核”配置已在技术路径上见效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。
该模型旨在解决自动驾驶与机器人间的知识迁移难题,意味着小米正尝试以通用AI逻辑驱动其庞大硬件生态——从手机到智能家居,再到智驾系统。
雷军曾提及,小米AI战略是“轻量化+本地部署”。可见,小米必将利用全球超10亿台设备的存量优势,依托AI拓展业务。
对小米而言,MiMo-V2-Flash的发布不止为抢占榜单席位,更是向资本市场与用户讲述新故事:
一家硬件巨头,正通过掌控高效“大脑”(AI模型)与广泛“身体”(人车家生态),力图在智能时代实现全面进化。
这个故事能否成真,不仅取决于模型性能,更关乎技术能否融入每一台小米设备,转化为用户可感知的体验。
本文由主机测评网于2026-02-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260224518.html