豆包手机助手引发AI风暴：AI Agent与互联网生态的冲突与未来

主机测评网
科技资讯
2026-03-01
1022

尽管豆包在前几天已经作出了正式回应，但这场由豆包手机助手引发的AI「封」暴仍在持续发酵。

2025年12月5日，努比亚M153（豆包手机助手技术预览手机）用户反馈，除了银行App无法正常使用外，部分互联网金融服务也因风控问题不支持M153。针对这一情况，豆包手机助手再次发布公告，重申「AI操作手机功能需用户明确授权，且执行任务过程中用户随时可中断。在操作第三方App若遇到敏感授权，需用户二次手动确认。」

豆包手机助手引发AI风暴：AI Agent与互联网生态的冲突与未来豆包手机助手 AI Agent GUI-Agent 互联网生态第1张

除此之外，豆包手机助手也对其AI功能作出调整：

1. 限制在各类App中用于刷分、刷激励的自动操作能力，以尊重厂商鼓励「真实用户主动交互」的初衷；

2. 进一步限制银行、互联网支付等金融类应用的代操作能力；

3. 对涉及竞技排名的部分游戏场景暂停开放AI使用，维护公平性。

从公告中提到的案例来看，在当前移动互联网生态下，豆包手机助手的理念确实有些过于超前——豆包想用GUI-Agent加速技术迭代，却没有意识到这套方案会对移动互联网生态造成多大的冲击。

不过话又说回来，既然大家都知道AI时代无法阻挡，AI-Agent替用户做事也不可避免，为什么互联网行业面对豆包手机助手这类「AI-Agent」依旧如临大敌？

互联网企业为何对AI手机如此谨慎？

从表面上看，努比亚M153之所以成为移动互联的「敏感机」，与它合理请求的敏感权限，或和「主板机」一样准确的交互特征有关——第三方应用无法判断这项权限究竟是用户亲手确认的，还是被不法分子和钓鱼软件诱导下授予的，只好以安全风控为由，先停止相关服务再慢慢排查。

但究其根本，GUI-Agent方案的出现，打破了全球互联网生态长期建立的入口逻辑。用户过去进入一个App，需要经过搜索、点击、跳转等路径，每一个步骤都关联着应用自己的分发、引流甚至商业化策略。

如果AI Agent能直接替用户完成整个发微博、点外卖的操作流，那原本属于应用的流量体系将分崩离析：GUI-Agent就像一个全能的「李跳跳」，能在用户完全不看不接触手机的情况下，在前台（GUI-Agent方案）或后台（MCP方案）直接帮用户把事情做了——无论摇一摇广告有多灵敏、关闭广告的「X」有多小，对用户而言广告曝光率都是零，因为用户根本不用看屏幕。

除此之外，AI-Agent代操作的「全托管」性质也可能引来一些关于公平性的争议。以大家都体验过的「红包助手」为例：

国内主流手机品牌都会在自己的系统中加入「红包助手」功能，让用户能以最短的时间领取红包。但就公序良俗的角度看，全自动的「红包助手」本质上就是「红包外挂」。在如何界定红包助手是否违规这件事上，微信采用了一个非常直接的办法——手机可以将红包的通知提前，但最终点击红包的步骤，必须由用户亲手点击。

豆包手机助手引发AI风暴：AI Agent与互联网生态的冲突与未来豆包手机助手 AI Agent GUI-Agent 互联网生态第2张

不过GUI-Agent的出现，打破了这种关于公平性的「默契」——用户可以借助GUI-Agent，以极快的速度、极高的频率进行抢票等操作，部分用户甚至将这一提高效率的系统功能用在了竞技游戏中，破坏了游戏的平衡性。

在这样的背景下，互联网公司选择谨慎对待GUI-Agent，我觉得也情有可原。说到底，大多数风控系统的设计从来没有考虑过「用户授权AI完成任务」这样的可能性，它们只能用已有的逻辑去判断是否存在风险。从这个角度看，豆包手机助手和App其实都没做错——只不过是突飞猛进的技术，将双方带到了未曾留意的「规则真空区」。

「能代理」才是AI Agent的及格线

在昨天文章的评论区中，雷科技也观察到了关于AI Agent的另一个观点：

这么下去，手机还需要一个主人吗？到底是AI助手？还是监视用户？

作为用户，我能理解读者这种质疑AI助手，认为AI助手「越俎代庖」的看法。毕竟并不是所有人有空看完豆包的隐私白皮书，也不是所有人都清楚豆包手机助手需要用户手动授权（可随时取消），在支付等敏感环节也必须要用户手动操作。

但就像你不能把自己的牌「托管」给AI，又不让AI看你的手牌一样。AI Agent作为一个革命性的效率工具，替用户执行任务本身就是它的基本能力。在雷科技看来，如果AI只能识别内容、回答问题，那它永远只是助手，而不是Agent。

而从实际情况来看，用户对AI Agent真正感兴趣，从来也不是「AI是否聪明」，而是它能不能替自己省下一段重复机械的劳动。举个例子：你用炒菜机器人炒菜，那吃到的是「没灵魂」的搅拌菜；但如果你做完饭后用洗碗机洗碗，那自然能把你从「重复的机械劳动」中解放。

豆包手机助手引发AI风暴：AI Agent与互联网生态的冲突与未来豆包手机助手 AI Agent GUI-Agent 互联网生态第3张

让AI Agent代理也是同样的逻辑：点餐、抢票、找便宜货、整理消息、提交表单，这些事的规则固定，自己做起来却有些「浪费时间」。对于那些不「直接产生价值」、也不体现创造力的工作，我并不认为让AI Agent「代劳」是一件本末倒置的事情，毕竟工具本身就是用来提升效率的。

AI手机是「洪水」，但不是「猛兽」

在雷科技看来，「豆包事件」虽然带来了争议，但也暴露出了AI时代独有的新问题：AI手机与互联网服务之间应该建立怎样的关系？

可以肯定的是，AI Agent与App这种「对立」的状况不会持续太久，未来两者也会以一种全新的方式协作。在MCP时代到来之前，App开发者会与AI手机品牌明确「允许AI操作」的范围，甚至可能引入全新的数字签名或授信制度，为常用的AI Agent操作「开白名单」，以「前台AI Agent」为练习场，打磨「后台MCP」时代的流程。

至于互联网公司，雷科技认为即使在MCP模式下，互联网企业也能体现出自己独特的价值，只不过在AI Agent时代（包括之后的MCP时代），互联网企业必须完成从「界面入口」到「能力接口」的转型。

以iPhone的Siri为例，基于苹果的SiriKit，微信、滴滴等App可以在前台拉起App的情况下，直接调用相关组件，完成发微信、叫网约车等操作。至于现在大家担心的「权限问题」，只要MCP协议普及，AI手机品牌也能摆脱事件注入触发、屏幕捕捉这种「曲线救国」的技术路径，用更合理、更安全的方式实现AI Agent的互联互通，让所有AI相关方都能在可控框架下运作。

豆包手机助手引发AI风暴：AI Agent与互联网生态的冲突与未来豆包手机助手 AI Agent GUI-Agent 互联网生态第4张

也只有这样，AI Agent才有可能真正进入我们的日常生活。

可以肯定的是，在AI Agent技术真正成熟、普及后，手机的使用方式必将迎来彻底的变化：用户负责给出方向性指令，AI Agent负责「动手」，第三方平台的组件则提供执行。三者之间的关系不会是谁替代谁，而是一种彼此依赖的协作结构。互联网公司依然掌握着服务能力，AI手机则成为新的入口，而用户得到的是更顺畅、更高效的体验。

12月4日晚，周鸿祎也在微博发布视频，将「智能助手之争」比作曾经的网约车、外卖补贴大战——「最终会让手机操作更简单，一句话就能办好所有事」。而在雷科技看来，在真正AI手机时代到来之际，除了我们用手机的方式，就连智能手机的形态也将再次改变。

说到底，技术革命是谁都拦不住的。当AI的浪潮席卷全行业时，巨头们自然会做出选择。