当前位置:首页 > 科技资讯 > 正文

豆包手机助手引发AI风暴:AI Agent与互联网生态的冲突与未来

尽管豆包在前几天已经作出了正式回应,但这场由豆包手机助手引发的AI「封」暴仍在持续发酵。

2025年12月5日,努比亚M153(豆包手机助手技术预览手机)用户反馈,除了银行App无法正常使用外,部分互联网金融服务也因风控问题不支持M153。针对这一情况,豆包手机助手再次发布公告,重申「AI操作手机功能需用户明确授权,且执行任务过程中用户随时可中断。在操作第三方App若遇到敏感授权,需用户二次手动确认。」

豆包手机助手引发AI风暴:AI Agent与互联网生态的冲突与未来 豆包手机助手 AI Agent GUI-Agent 互联网生态 第1张

除此之外,豆包手机助手也对其AI功能作出调整:

1. 限制在各类App中用于刷分、刷激励的自动操作能力,以尊重厂商鼓励「真实用户主动交互」的初衷;

2. 进一步限制银行、互联网支付等金融类应用的代操作能力;

3. 对涉及竞技排名的部分游戏场景暂停开放AI使用,维护公平性。

从公告中提到的案例来看,在当前移动互联网生态下,豆包手机助手的理念确实有些过于超前——豆包想用GUI-Agent加速技术迭代,却没有意识到这套方案会对移动互联网生态造成多大的冲击。

不过话又说回来,既然大家都知道AI时代无法阻挡,AI-Agent替用户做事也不可避免,为什么互联网行业面对豆包手机助手这类「AI-Agent」依旧如临大敌?

互联网企业为何对AI手机如此谨慎?

从表面上看,努比亚M153之所以成为移动互联的「敏感机」,与它合理请求的敏感权限,或和「主板机」一样准确的交互特征有关——第三方应用无法判断这项权限究竟是用户亲手确认的,还是被不法分子和钓鱼软件诱导下授予的,只好以安全风控为由,先停止相关服务再慢慢排查。

但究其根本,GUI-Agent方案的出现,打破了全球互联网生态长期建立的入口逻辑。用户过去进入一个App,需要经过搜索、点击、跳转等路径,每一个步骤都关联着应用自己的分发、引流甚至商业化策略。

如果AI Agent能直接替用户完成整个发微博、点外卖的操作流,那原本属于应用的流量体系将分崩离析:GUI-Agent就像一个全能的「李跳跳」,能在用户完全不看不接触手机的情况下,在前台(GUI-Agent方案)或后台(MCP方案)直接帮用户把事情做了——无论摇一摇广告有多灵敏、关闭广告的「X」有多小,对用户而言广告曝光率都是零,因为用户根本不用看屏幕。

除此之外,AI-Agent代操作的「全托管」性质也可能引来一些关于公平性的争议。以大家都体验过的「红包助手」为例:

国内主流手机品牌都会在自己的系统中加入「红包助手」功能,让用户能以最短的时间领取红包。但就公序良俗的角度看,全自动的「红包助手」本质上就是「红包外挂」。在如何界定红包助手是否违规这件事上,微信采用了一个非常直接的办法——手机可以将红包的通知提前,但最终点击红包的步骤,必须由用户亲手点击。

豆包手机助手引发AI风暴:AI Agent与互联网生态的冲突与未来 豆包手机助手 AI Agent GUI-Agent 互联网生态 第2张

不过GUI-Agent的出现,打破了这种关于公平性的「默契」——用户可以借助GUI-Agent,以极快的速度、极高的频率进行抢票等操作,部分用户甚至将这一提高效率的系统功能用在了竞技游戏中,破坏了游戏的平衡性。

在这样的背景下,互联网公司选择谨慎对待GUI-Agent,我觉得也情有可原。说到底,大多数风控系统的设计从来没有考虑过「用户授权AI完成任务」这样的可能性,它们只能用已有的逻辑去判断是否存在风险。从这个角度看,豆包手机助手和App其实都没做错——只不过是突飞猛进的技术,将双方带到了未曾留意的「规则真空区」。

「能代理」才是AI Agent的及格线

在昨天文章的评论区中,雷科技也观察到了关于AI Agent的另一个观点:

这么下去,手机还需要一个主人吗?到底是AI助手?还是监视用户?

作为用户,我能理解读者这种质疑AI助手,认为AI助手「越俎代庖」的看法。毕竟并不是所有人有空看完豆包的隐私白皮书,也不是所有人都清楚豆包手机助手需要用户手动授权(可随时取消),在支付等敏感环节也必须要用户手动操作。

但就像你不能把自己的牌「托管」给AI,又不让AI看你的手牌一样。AI Agent作为一个革命性的效率工具,替用户执行任务本身就是它的基本能力。在雷科技看来,如果AI只能识别内容、回答问题,那它永远只是助手,而不是Agent。

而从实际情况来看,用户对AI Agent真正感兴趣,从来也不是「AI是否聪明」,而是它能不能替自己省下一段重复机械的劳动。举个例子:你用炒菜机器人炒菜,那吃到的是「没灵魂」的搅拌菜;但如果你做完饭后用洗碗机洗碗,那自然能把你从「重复的机械劳动」中解放。

豆包手机助手引发AI风暴:AI Agent与互联网生态的冲突与未来 豆包手机助手 AI Agent GUI-Agent 互联网生态 第3张

让AI Agent代理也是同样的逻辑:点餐、抢票、找便宜货、整理消息、提交表单,这些事的规则固定,自己做起来却有些「浪费时间」。对于那些不「直接产生价值」、也不体现创造力的工作,我并不认为让AI Agent「代劳」是一件本末倒置的事情,毕竟工具本身就是用来提升效率的。

AI手机是「洪水」,但不是「猛兽」

在雷科技看来,「豆包事件」虽然带来了争议,但也暴露出了AI时代独有的新问题:AI手机与互联网服务之间应该建立怎样的关系?

可以肯定的是,AI Agent与App这种「对立」的状况不会持续太久,未来两者也会以一种全新的方式协作。在MCP时代到来之前,App开发者会与AI手机品牌明确「允许AI操作」的范围,甚至可能引入全新的数字签名或授信制度,为常用的AI Agent操作「开白名单」,以「前台AI Agent」为练习场,打磨「后台MCP」时代的流程。

至于互联网公司,雷科技认为即使在MCP模式下,互联网企业也能体现出自己独特的价值,只不过在AI Agent时代(包括之后的MCP时代),互联网企业必须完成从「界面入口」到「能力接口」的转型。

以iPhone的Siri为例,基于苹果的SiriKit,微信、滴滴等App可以在前台拉起App的情况下,直接调用相关组件,完成发微信、叫网约车等操作。至于现在大家担心的「权限问题」,只要MCP协议普及,AI手机品牌也能摆脱事件注入触发、屏幕捕捉这种「曲线救国」的技术路径,用更合理、更安全的方式实现AI Agent的互联互通,让所有AI相关方都能在可控框架下运作。

豆包手机助手引发AI风暴:AI Agent与互联网生态的冲突与未来 豆包手机助手 AI Agent GUI-Agent 互联网生态 第4张

也只有这样,AI Agent才有可能真正进入我们的日常生活。

可以肯定的是,在AI Agent技术真正成熟、普及后,手机的使用方式必将迎来彻底的变化:用户负责给出方向性指令,AI Agent负责「动手」,第三方平台的组件则提供执行。三者之间的关系不会是谁替代谁,而是一种彼此依赖的协作结构。互联网公司依然掌握着服务能力,AI手机则成为新的入口,而用户得到的是更顺畅、更高效的体验。

12月4日晚,周鸿祎也在微博发布视频,将「智能助手之争」比作曾经的网约车、外卖补贴大战——「最终会让手机操作更简单,一句话就能办好所有事」。而在雷科技看来,在真正AI手机时代到来之际,除了我们用手机的方式,就连智能手机的形态也将再次改变。

说到底,技术革命是谁都拦不住的。当AI的浪潮席卷全行业时,巨头们自然会做出选择。