当前位置:首页 > 科技资讯 > 正文

小米AI大模型新突破:罗福莉首秀发布MiMo-V2-Flash,开启智能体新纪元

12月17日,备受瞩目的小米2025人车家全生态合作伙伴大会如期举行。然而,全场的聚光灯几乎都集中在了其中一位演讲嘉宾身上——小米Mimo大模型负责人罗福莉。

自从离开DeepSeek并低调加入小米后,这位被誉为“AI天才少女”的罗福莉首次以小米大模型团队代表身份公开亮相,引发业界广泛关注。就在大会开幕前夕,小米正式发布并开源了其最新的MoE大模型MiMo-V2-Flash,而这也成为罗福莉此次演讲的核心主题。

在演讲开场,罗福莉便指出,下一代智能体系统的核心将围绕Agent执行与Omni(全能)感知展开,涵盖记忆、推理、自主规划、决策、执行等多个维度。她强调,智能体应当从单纯的“回答问题”向“完成任务”演进,并需要统一多模态感知能力,为理解物理世界奠定基础。

基于这一理念,她进一步阐述,MiMo-V2-Flash在研发初期便聚焦于三个关键问题。

首先,当代智能体必须具备高效的沟通语言,即强大的代码能力和工具调用能力;其次,“高带宽”是Agent协作的关键,因此模型结构设计必须追求极致的推理效率;第三,随着模型训练范式从预训练逐步转向后训练,为了充分释放后训练的潜力,需要构建高效且稳定的扩展强化学习训练机制。

小米AI大模型新突破:罗福莉首秀发布MiMo-V2-Flash,开启智能体新纪元 小米 AI大模型 罗福莉 智能体 第1张

图自界面新闻

作为小米专为Agent场景打造的新一代基座模型,MiMo-V2-Flash总参数量达到309B,激活参数为15B,支持256k的上下文窗口。该模型针对推理、编码及Agent应用进行了深度优化,支持混合思维模式,用户可根据需要在“思考”模式与即时回答模式之间灵活切换。

在多项基准测试中,MiMo-V2-Flash的表现与DeepSeek-V3.2整体接近,在SWE-Bench Verified/Multiligual、GPQA-Diamond等测试中甚至略有领先,仅在HLE(人类最后的考试)及Arena-Hard(创意写作评估)两项上稍逊一筹。此外,该模型在AIME2025能力测试中表现接近GPT-5和Gemini 3.0 Pro,显示出强大的数学推理潜力。

作为罗福莉加盟小米后的首秀成果,MiMo-V2-Flash不仅是技术实力的体现,更被视为小米未来全面赋能各业务场景的智能体核心底座。因此,她在演讲中花了大量篇幅详细解读该模型的性价比优势及其背后的技术创新。

据透露,MiMo-V2-Flash的推理吞吐速度高达每秒150个token,定价仅为每百万输入token 0.7元,每百万输出token 2.1元,极具成本竞争力。

在价格与速度构成的坐标系中,MiMo-V2-Flash的速度与Gemini-2.5 Pro持平,但价格仅为后者的约二十分之一;与DeepSeek V3.2相比,其价格约便宜一半,而速度却是后者的近三倍,展现出卓越的性价比。

如此高效的推理性能主要归功于两项核心技术突破。其一是模型注意力机制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑动窗口注意力机制),其中SWA与Full Attention(全局注意力机制)的比例为5:1。

罗福莉解释说,相较于复杂的Linear Attention(线性注意力机制),SWA在处理长短文本推理、知识检索等方面表现更优,能够更好地平衡效率与效果。

一位AI大模型行业的资深从业者对界面新闻记者分析道,SWA本质上是一种Sparse Attention(稀疏注意力机制),业界常用它来解决长上下文推理的效率难题。其最大优势在于能将KV Cache维持在一个固定最大值,避免随上下文增长而无限膨胀,从而实现显著的降本增效。

不过他也指出,该机制在长文本任务中可能因窗口限制而影响表现,这也是为何需要将SWA与Full Attention按比例混合使用的原因。

另一项关键创新在于MTP(Multi-Token Prediction)。罗福莉透露,团队在训练阶段加入了一层MTP层以提升基座模型的能力,在微调阶段又增加了更多MTP层,最终在推理时采用3层MTP,通过加速并行token验证的方式,使推理速度提升了2至2.6倍。

此外,为了增强强化学习训练的稳定性,MiMo团队还提出了一种名为Multi-Teacher On-Policy Distillation(MOPD)的后训练范式。与传统SFT+RL(微调+强化学习)方法相比,MOPD能够提供稠密的token级监督学习信号,从而更简单快速地融合各专家模型的能力。

“我们还发现一个有趣的现象:当学生模型快速超越老师模型时,我们能否将老师替换为学生,实现自我迭代提升?这目前是我们正在探索的方向。”罗福莉在演讲中透露了团队的前沿思考。

小米AI大模型新突破:罗福莉首秀发布MiMo-V2-Flash,开启智能体新纪元 小米 AI大模型 罗福莉 智能体 第2张

图自界面新闻

从这场演讲可以看出,罗福莉在小米大模型团队的角色远不止于科学家,她肩负着带领团队打造能够真正落地于小米“人车家全生态”产品的AI基座模型及应用能力的重任。在汽车、手机、大家电、智能穿戴等硬件产品线纷纷跨越阶段性门槛的当下,AI能力正成为小米支撑下一个十年技术叙事的核心基石。

有趣的是,罗福莉本人几乎未谈及个人,仅在提及团队构成时描述为一个“小而美,却充满创业精神、极度好奇、追求真理”的年轻团队。她还强调,在大模型的能力竞争中,算力和数据并非最终护城河,“真正重要的是科学的研究文化与方法,是将未知问题结合模型优势转化为可用产品的能力”。

此外,小米集团合伙人、集团总裁卢伟冰也在大会上披露了“人车家全生态”的最新进展:小米全球月活跃用户数已达7.42亿;小米AIoT平台连接设备数突破10.4亿,硬件合作伙伴超15000家;全球开发者规模达120万,国内应用生态每月应用分发量超过11亿,展现出强大的生态活力。