当前位置:首页 > 科技资讯 > 正文

字节豆包AI手机战略深化:努比亚M153试水之后,vivo等头部厂商加速入局

字节豆包AI手机战略深化:努比亚M153试水之后,vivo等头部厂商加速入局 AI手机 豆包助手 端侧Agent 字节跳动 第1张

努比亚与字节合作推出的M153机型仍有3万台库存待消化,但这并未影响豆包在手机终端侧的合作版图持续扩张。继中兴之后,vivo、联想、传音等厂商正与字节跳动推进AI手机相关合作,计划在其设备中预装AIGC能力插件,多位vivo内部人士已向媒体确认合作已进入细节磋商阶段。

不过,目前流出的合作信息尚不足以断定上述项目会完全复制M153的深度整合模式。在M153上,字节首次在系统层级植入了GUI Agent,该智能体能够依据用户指令自动调度并完成跨应用操作,尽管这一尝试很快遭遇微信、淘宝等超级App的技术限制与策略反制。

即便如此,M153依然成功向业界传递出一个明确信号:手机厂商对系统级AI Agent的兴趣已被点燃。随着字节携豆包大模型能力入场,终端原生AI生态的版图正以前所未有的速度扩张。

这一动向在近期火山引擎FORCE原动力大会上得到充分体现。中兴、荣耀、小米、vivo等多家头部终端厂商现身站台,但除中兴与字节联合打磨的M153外,多数品牌与豆包的合作仍停留在模型能力调用层面,Agent的产品定义、交互范式及系统级整合主导权,仍掌握在手机厂商自己手中。

火山引擎总裁谭待在大会群访环节对直面AI表示:“AI的核心价值在于以更低门槛、更自然的方式放大用户需求。”他强调,不论技术形态如何演变,满足未被充分服务的用户场景才是根本。

可以预见,无论字节与vivo等厂商最终以何种方式落地合作,一个产业共识已愈发清晰:系统级Agent正从概念走向现实,即便落地过程中仍有摩擦与阻力,M153已经为行业勾勒出未来人机交互的雏形。

无论是技术输出方还是终端整合方,大模型与手机厂商们正以“做大需求、做强体验”为口号,加速涌入这条尚未定型但潜力巨大的赛道。

1

手机厂商之所以集体向字节等大模型厂商靠拢,根本驱动力在于终端AI助手坐拥天然且庞大的用户池。QuestMobile 2025年三季度报告显示,截至2025年9月,移动端AI应用月活跃用户总数已达7.29亿;其中“手机厂商预装AI助手”覆盖约5.35亿用户,远超“原生AI应用”的2.87亿,而“应用内嵌AI”则以7.06亿居首。

换言之,系统级AI助手的用户触达效率与使用惯性,远非独立App可比。如何让AI从被动响应的语音工具进化为主动服务的系统智能体,已成为主流厂商的共识性命题;受限于早期模型能力与工程稳定性,多数尝试长期停留在“语音助手增强版”阶段,而豆包手机助手的出现,直接撕开了通往GUI Agent实战的大门。

尽管M153的商业化表现尚存争议,但它首次在获得OS授权后实现了跨应用任务的全自动接管,让行业真切看到了完整版GUI Agent的可能性。这种形态所打开的想象空间,并不会因部分头部App的防御性反制而消退。

与此同时,大模型在指令跟随、多轮规划与工具调用层面的能力在过去两年间实现了代际跃升;端侧算力、内存与推理效率的持续突破,也使“纯端执行”从愿景走向可行。根据Counterpoint分析,2025年旗舰级移动SoC中支持生成式AI的比例已达88%,AI峰值算力普遍逼近100 TOPS,约为2021年水平的四倍。

AI大规模“登机”的技术前提已经就位,Siri时代以固定指令集为核心的语音交互逻辑,已无法承载用户对“真智能”的期待。

在此窗口期,手机厂商亟需在硬件同质化之外找到系统层的新体验锚点;而AI云厂商恰好输出成熟的模型与工程化能力。双方从试探性接触到规模化合作,并非偶然的商业撮合,而是技术供给与产业需求双向奔赴的结果。

正因如此,尽管M153仅有三万台工程机规模,它仍像一枚信号弹,为早已暗中蓄力的手机行业吹响了冲锋号。

在此背景下,市场传出vivo等体量更大的厂商与字节推进合作,实属情理之中。但这不意味着所有厂商都会复刻M153的深度定制路径。vivo早已发布自研蓝心大模型与“蓝心智能”战略,强调OriginOS系统级智能体的自主演进。

荣耀则是另一类代表:YOYO Agent已接入豆包大模型的部分能力,但Agent的训练、产品逻辑与系统整合仍由荣耀主导。这种“能力接入而非产品外包”的模式,或将成为更多厂商在当前阶段的现实选择。

值得注意的是,荣耀首席影像工程师罗巍曾公开评价:“字节没有硬件研发积淀,与中兴的合作是两个短板叠加,难以产生质变。”但在此番言论后,荣耀展台依然作为火山引擎合作伙伴出现在原动力大会上。

回顾字节此次激进尝试,并非脱离产业节奏的冒进,而是精准踩在了技术成熟与需求爆发的交汇点上。M153的意义不在于证明单一产品的成功,而在于让全行业确信:端侧Agent已是一条无法回避的演化路径。

而面对微信、淘宝等超级App不断筑高的权限与数据城墙,Agent与App的关系,正成为智能体落地必须回答的下一题。

2

豆包手机助手问世后,业内迅速出现一种核心焦虑:当AI能直接理解意图并代为操作,Agent是否会成为传统App的颠覆者?

在火山引擎原动力大会群访中,谭待直面直面AI的提问,从用户视角给出回应:“假如用户想点一杯咖啡,无论通过语音机器人还是手动操作App完成,最终目的都是满足需求。”他指出,当下仍有大量日常需求未被高效满足,AI的价值在于用更低成本将这些需求释放出来。

“至于承载AI的形态是Web、独立App、Agent,或是套了App壳的Agent,或许并没有那么重要。”谭待这样总结。

因此,回归手机原生助手层面,能“操纵”多少App从来不是问题核心;真正关键的是AI能否以更低的使用摩擦,把原本被压抑的需求转化为实际交互。当需求被“做大”,硬件层面便能建立起全新的用户心智——尤其在AI已不再陌生的2025年。

QuestMobile数据显示,截至2025年第一季度,原生AI应用用户从“尝鲜”转向“依赖”的趋势明显:月人均使用次数同比增速(53.1%)显著高于月人均使用时长的增速(32.7%),反映出用户倾向于高频、短时地通过AI完成即时性任务。

这类场景正是手机原生Agent最擅长的增量空间。但这是典型的做大蛋糕逻辑,并不意味着App的价值短期内会被快速削弱。

中国信通院2024年发布的数字应用生态报告指出,用户使用时长仍高度集中于少数头部App,支付、即时通讯、短视频三类应用合计占据超过八成用户总时长。这些App承载的账户体系、支付闭环、内容生态与安全责任,短期内不具备被Agent直接替代的条件。

换言之,Agent正在改变App的“入口位置”,而非消解其存在价值。

在这一新结构中,App依然是能力与服务的封装体,但不再是用户表达需求的唯一起点;Agent逐渐演变为“需求调度层”,负责理解意图、拆解任务,并将执行分发给不同应用或系统能力。

甚至,用户驱动Agent的终端未必局限于手机。

Counterpoint Research追踪数据显示,2025年智能可穿戴设备中,具备本地AI能力的终端出货量显著攀升。2025年上半年,全球智能眼镜出货量同比增长超110%,其中AI眼镜占比大幅提升,折射出业界对端侧AI能力的快速采纳。

在这一趋势下,字节不会是唯一入局的大模型厂商。智谱AI近期已将核心Agent模型AutoGLM开源,允许开发者基于该模型构建具备“Phone Use”能力的终端智能体。AutoGLM可理解屏幕内容,通过模拟点击、滑动、输入等操作完成多步骤任务,目前已适配微信、淘宝、抖音、美团等超过50个高频中文应用。

当更多大模型厂商争相“上机”,分水岭就不再仅仅是模型接入,而是手机厂商是否愿意将系统层的AI入口与规则让渡出去。下一阶段的竞争,本质上是“系统能力与生态掌控力”的较量。

3

如果说nubia M153是一次面向未来的工程验证,那么在它发布数周后,小米在人车家全生态大会上披露的澎湃OS与AI进展,则代表着头部手机厂商的同步反击。

小米并未将重心放在某一项单点功能上,而是反复强调澎湃OS作为系统级底座的战略定位——它正在成为连接手机、平板、电视及各类IoT终端的统一操作系统框架,也是AI能力被编排、调度与约束的核心层级。

这一战略并非停留于概念。据小米官方数据,截至2024年底,小米AIoT平台连接设备数已超8.2亿台,横跨手机、平板、电视、穿戴与智能家居。澎湃OS的目标正是将这些分散设备纳入统一系统框架,使AI能力在不同终端间灵活调度复用,而非寄生在单一应用内。

这意味着小米选择将AI能力牢牢锚定在操作系统内部,且这一系统的硬件生态规模足够庞大。小米MiMo大模型负责人罗福莉在本次大会首次公开亮相时,将AI能力演进的重点置于任务理解与执行层面,强调模型需具备对复杂需求进行拆解、规划并与系统能力协同完成的能力,而非止步于单轮问答或内容生成。

从产业结构看,这条路径与字节代表的AI云厂商模式形成了清晰对照。头部AI厂商渴望进入手机Agent市场,逻辑简单:手机仍是用户最高频、最稳固的交互入口;但对手机厂商而言,操作系统、硬件整合与生态控制力才是其长期护城河。一旦Agent深度嵌入系统层,谁来定义交互范式、权限边界与默认入口,将直接决定产业主导权的归属。

这也解释了为何多数头部厂商在引入外部模型能力的同时,仍坚持自研Agent框架与系统级助手。它们更倾向于将云厂商定位为能力提供者,而非产品定义者。

这条路径早有先例。华为在推进HarmonyOS与小艺助手的过程中,持续强化系统级调度与跨设备协同,将AI能力作为操作系统的原生组件加以演进。据华为2024年开发者大会数据,HarmonyOS生态已覆盖8亿+设备,注册开发者超220万,小艺不再作为独立应用,而是深度参与系统调度与多终端协同。

在智能眼镜、耳机等新形态终端上,这种生态差异被进一步放大。对于屏幕受限、操作碎片化的设备,Agent更接近“基础交互层”,品牌与系统协同能力的重要性往往超越单一模型能力。

在这一点上,传统硬件厂商具备天然优势,但字节、阿里等AI厂商也在积极布局自有的AI硬件业务。小艺与超级小爱能否在端侧体验上全面超越豆包,目前仍是未知数。

但近期手机圈对豆包及其他AI能力的集体加码已清晰表明:无论是AI厂商还是手机厂商,都已将目光锁定在AI手机这一仍待开垦的系统级疆域。

在豆包手机助手这颗“信号弹”的牵引下,2026年AI手机赛道极有可能迎来“做大做强”的爆发之年。