当前位置：首页 > 科技资讯 > 正文

字节豆包AI手机战略深化：努比亚M153试水之后，vivo等头部厂商加速入局

主机测评网
科技资讯
2026-02-12
989

字节豆包AI手机战略深化：努比亚M153试水之后，vivo等头部厂商加速入局 AI手机豆包助手端侧Agent 字节跳动第1张

努比亚与字节合作推出的M153机型仍有3万台库存待消化，但这并未影响豆包在手机终端侧的合作版图持续扩张。继中兴之后，vivo、联想、传音等厂商正与字节跳动推进AI手机相关合作，计划在其设备中预装AIGC能力插件，多位vivo内部人士已向媒体确认合作已进入细节磋商阶段。

不过，目前流出的合作信息尚不足以断定上述项目会完全复制M153的深度整合模式。在M153上，字节首次在系统层级植入了GUI Agent，该智能体能够依据用户指令自动调度并完成跨应用操作，尽管这一尝试很快遭遇微信、淘宝等超级App的技术限制与策略反制。

即便如此，M153依然成功向业界传递出一个明确信号：手机厂商对系统级AI Agent的兴趣已被点燃。随着字节携豆包大模型能力入场，终端原生AI生态的版图正以前所未有的速度扩张。

这一动向在近期火山引擎FORCE原动力大会上得到充分体现。中兴、荣耀、小米、vivo等多家头部终端厂商现身站台，但除中兴与字节联合打磨的M153外，多数品牌与豆包的合作仍停留在模型能力调用层面，Agent的产品定义、交互范式及系统级整合主导权，仍掌握在手机厂商自己手中。

火山引擎总裁谭待在大会群访环节对直面AI表示：“AI的核心价值在于以更低门槛、更自然的方式放大用户需求。”他强调，不论技术形态如何演变，满足未被充分服务的用户场景才是根本。

可以预见，无论字节与vivo等厂商最终以何种方式落地合作，一个产业共识已愈发清晰：系统级Agent正从概念走向现实，即便落地过程中仍有摩擦与阻力，M153已经为行业勾勒出未来人机交互的雏形。

无论是技术输出方还是终端整合方，大模型与手机厂商们正以“做大需求、做强体验”为口号，加速涌入这条尚未定型但潜力巨大的赛道。

1

手机厂商之所以集体向字节等大模型厂商靠拢，根本驱动力在于终端AI助手坐拥天然且庞大的用户池。QuestMobile 2025年三季度报告显示，截至2025年9月，移动端AI应用月活跃用户总数已达7.29亿；其中“手机厂商预装AI助手”覆盖约5.35亿用户，远超“原生AI应用”的2.87亿，而“应用内嵌AI”则以7.06亿居首。

换言之，系统级AI助手的用户触达效率与使用惯性，远非独立App可比。如何让AI从被动响应的语音工具进化为主动服务的系统智能体，已成为主流厂商的共识性命题；受限于早期模型能力与工程稳定性，多数尝试长期停留在“语音助手增强版”阶段，而豆包手机助手的出现，直接撕开了通往GUI Agent实战的大门。

尽管M153的商业化表现尚存争议，但它首次在获得OS授权后实现了跨应用任务的全自动接管，让行业真切看到了完整版GUI Agent的可能性。这种形态所打开的想象空间，并不会因部分头部App的防御性反制而消退。

与此同时，大模型在指令跟随、多轮规划与工具调用层面的能力在过去两年间实现了代际跃升；端侧算力、内存与推理效率的持续突破，也使“纯端执行”从愿景走向可行。根据Counterpoint分析，2025年旗舰级移动SoC中支持生成式AI的比例已达88%，AI峰值算力普遍逼近100 TOPS，约为2021年水平的四倍。

AI大规模“登机”的技术前提已经就位，Siri时代以固定指令集为核心的语音交互逻辑，已无法承载用户对“真智能”的期待。

在此窗口期，手机厂商亟需在硬件同质化之外找到系统层的新体验锚点；而AI云厂商恰好输出成熟的模型与工程化能力。双方从试探性接触到规模化合作，并非偶然的商业撮合，而是技术供给与产业需求双向奔赴的结果。

正因如此，尽管M153仅有三万台工程机规模，它仍像一枚信号弹，为早已暗中蓄力的手机行业吹响了冲锋号。

在此背景下，市场传出vivo等体量更大的厂商与字节推进合作，实属情理之中。但这不意味着所有厂商都会复刻M153的深度定制路径。vivo早已发布自研蓝心大模型与“蓝心智能”战略，强调OriginOS系统级智能体的自主演进。

荣耀则是另一类代表：YOYO Agent已接入豆包大模型的部分能力，但Agent的训练、产品逻辑与系统整合仍由荣耀主导。这种“能力接入而非产品外包”的模式，或将成为更多厂商在当前阶段的现实选择。

值得注意的是，荣耀首席影像工程师罗巍曾公开评价：“字节没有硬件研发积淀，与中兴的合作是两个短板叠加，难以产生质变。”但在此番言论后，荣耀展台依然作为火山引擎合作伙伴出现在原动力大会上。

回顾字节此次激进尝试，并非脱离产业节奏的冒进，而是精准踩在了技术成熟与需求爆发的交汇点上。M153的意义不在于证明单一产品的成功，而在于让全行业确信：端侧Agent已是一条无法回避的演化路径。

而面对微信、淘宝等超级App不断筑高的权限与数据城墙，Agent与App的关系，正成为智能体落地必须回答的下一题。

2

豆包手机助手问世后，业内迅速出现一种核心焦虑：当AI能直接理解意图并代为操作，Agent是否会成为传统App的颠覆者？

在火山引擎原动力大会群访中，谭待直面直面AI的提问，从用户视角给出回应：“假如用户想点一杯咖啡，无论通过语音机器人还是手动操作App完成，最终目的都是满足需求。”他指出，当下仍有大量日常需求未被高效满足，AI的价值在于用更低成本将这些需求释放出来。

“至于承载AI的形态是Web、独立App、Agent，或是套了App壳的Agent，或许并没有那么重要。”谭待这样总结。

因此，回归手机原生助手层面，能“操纵”多少App从来不是问题核心；真正关键的是AI能否以更低的使用摩擦，把原本被压抑的需求转化为实际交互。当需求被“做大”，硬件层面便能建立起全新的用户心智——尤其在AI已不再陌生的2025年。

QuestMobile数据显示，截至2025年第一季度，原生AI应用用户从“尝鲜”转向“依赖”的趋势明显：月人均使用次数同比增速（53.1%）显著高于月人均使用时长的增速（32.7%），反映出用户倾向于高频、短时地通过AI完成即时性任务。

这类场景正是手机原生Agent最擅长的增量空间。但这是典型的做大蛋糕逻辑，并不意味着App的价值短期内会被快速削弱。

中国信通院2024年发布的数字应用生态报告指出，用户使用时长仍高度集中于少数头部App，支付、即时通讯、短视频三类应用合计占据超过八成用户总时长。这些App承载的账户体系、支付闭环、内容生态与安全责任，短期内不具备被Agent直接替代的条件。

换言之，Agent正在改变App的“入口位置”，而非消解其存在价值。

在这一新结构中，App依然是能力与服务的封装体，但不再是用户表达需求的唯一起点；Agent逐渐演变为“需求调度层”，负责理解意图、拆解任务，并将执行分发给不同应用或系统能力。

甚至，用户驱动Agent的终端未必局限于手机。

Counterpoint Research追踪数据显示，2025年智能可穿戴设备中，具备本地AI能力的终端出货量显著攀升。2025年上半年，全球智能眼镜出货量同比增长超110%，其中AI眼镜占比大幅提升，折射出业界对端侧AI能力的快速采纳。

在这一趋势下，字节不会是唯一入局的大模型厂商。智谱AI近期已将核心Agent模型AutoGLM开源，允许开发者基于该模型构建具备“Phone Use”能力的终端智能体。AutoGLM可理解屏幕内容，通过模拟点击、滑动、输入等操作完成多步骤任务，目前已适配微信、淘宝、抖音、美团等超过50个高频中文应用。

当更多大模型厂商争相“上机”，分水岭就不再仅仅是模型接入，而是手机厂商是否愿意将系统层的AI入口与规则让渡出去。下一阶段的竞争，本质上是“系统能力与生态掌控力”的较量。

3

如果说nubia M153是一次面向未来的工程验证，那么在它发布数周后，小米在人车家全生态大会上披露的澎湃OS与AI进展，则代表着头部手机厂商的同步反击。

小米并未将重心放在某一项单点功能上，而是反复强调澎湃OS作为系统级底座的战略定位——它正在成为连接手机、平板、电视及各类IoT终端的统一操作系统框架，也是AI能力被编排、调度与约束的核心层级。

这一战略并非停留于概念。据小米官方数据，截至2024年底，小米AIoT平台连接设备数已超8.2亿台，横跨手机、平板、电视、穿戴与智能家居。澎湃OS的目标正是将这些分散设备纳入统一系统框架，使AI能力在不同终端间灵活调度复用，而非寄生在单一应用内。

这意味着小米选择将AI能力牢牢锚定在操作系统内部，且这一系统的硬件生态规模足够庞大。小米MiMo大模型负责人罗福莉在本次大会首次公开亮相时，将AI能力演进的重点置于任务理解与执行层面，强调模型需具备对复杂需求进行拆解、规划并与系统能力协同完成的能力，而非止步于单轮问答或内容生成。

从产业结构看，这条路径与字节代表的AI云厂商模式形成了清晰对照。头部AI厂商渴望进入手机Agent市场，逻辑简单：手机仍是用户最高频、最稳固的交互入口；但对手机厂商而言，操作系统、硬件整合与生态控制力才是其长期护城河。一旦Agent深度嵌入系统层，谁来定义交互范式、权限边界与默认入口，将直接决定产业主导权的归属。

这也解释了为何多数头部厂商在引入外部模型能力的同时，仍坚持自研Agent框架与系统级助手。它们更倾向于将云厂商定位为能力提供者，而非产品定义者。

这条路径早有先例。华为在推进HarmonyOS与小艺助手的过程中，持续强化系统级调度与跨设备协同，将AI能力作为操作系统的原生组件加以演进。据华为2024年开发者大会数据，HarmonyOS生态已覆盖8亿+设备，注册开发者超220万，小艺不再作为独立应用，而是深度参与系统调度与多终端协同。

在智能眼镜、耳机等新形态终端上，这种生态差异被进一步放大。对于屏幕受限、操作碎片化的设备，Agent更接近“基础交互层”，品牌与系统协同能力的重要性往往超越单一模型能力。

在这一点上，传统硬件厂商具备天然优势，但字节、阿里等AI厂商也在积极布局自有的AI硬件业务。小艺与超级小爱能否在端侧体验上全面超越豆包，目前仍是未知数。

但近期手机圈对豆包及其他AI能力的集体加码已清晰表明：无论是AI厂商还是手机厂商，都已将目光锁定在AI手机这一仍待开垦的系统级疆域。

在豆包手机助手这颗“信号弹”的牵引下，2026年AI手机赛道极有可能迎来“做大做强”的爆发之年。