当前位置:首页 > 科技资讯 > 正文

WebMCP重塑AI与网页交互时代

近日,谷歌Chrome团队带来了一记震撼弹:Web模型上下文协议(WebMCP)正式登场。

这一革命性技术让AI智能体得以跨越「人类用户界面」的界限,与现有网站和Web应用实现深度交互。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第1张

在Chrome 146的早期预览版中,只需开启特定标志,即可体验WebMCP。

这意味着,AI Agent从此无需再「伪装成人类」,而是可以直接通过API与Web应用的核心服务进行对话。

通过navigator.modelContext这一API,AI能够绕过传统的图形界面,实现更高效、更精准的交互。

例如,订机票时,Agent无需在屏幕上点击操作,而是直接通过底层协议发送指令,获取所需结果。

开发者Alex Volkov形象地比喻道:「WebMCP相当于UI中的API」。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第2张

WebMCP的诞生,无疑释放了一个明确的信号——AI Agent与网页交互的底层逻辑,正迎来一场前所未有的重塑。

这一技术实现了从「视觉模拟」到「逻辑直连」的飞跃,让传统的Web交互范式逐渐走向终结。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第3张

WebMCP震撼登场

掀起Agent交互革命

尽管很多人尚未意识到WebMCP的重要性,但其核心改变在于,它让Agent获取服务的方式发生了根本性变革。

如今,Agent不再需要模拟人类行为——截屏、识别按钮位置、模拟点击等——而是直接拿到了网页的「核心钥匙」。

过去几周,全球对OpenClaw的热度持续高涨,若未来交互技术再进一步,或许将催生新的变革。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第4张

目前,Agent操作网页的方式既笨拙又原始,且集成方式「太拉胯」。

它们本质上是在模拟人类行为,这种方式存在诸多痛点:

  • 成本高昂:简单的搜索可能需要数千token来处理截图和解析页面;
  • 稳定性低:网站一旦改版,Agent可能因找不到按钮而陷入「瘫痪」;
  • 反馈低效:Agent必须反复「查看」屏幕以确认操作是否成功。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第5张

降维打击:无需再「装个人」

如今,有了WebMCP,网站可以直接向AI开放服务接口。Agent无需经过「前端视觉界面」,即可查询并执行服务。

WebMCP将取代传统的「屏幕抓取」(screen-scraping),实现更稳定、更高效的页面交互和信息检索。

正如网友所言,AI Agent正逐步成为网络的「一等公民」。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第6张

在谷歌Chrome 146的官方博客中,为开发者提供了两套灵活的API接入方式:

  • 声明性API:执行可直接在HTML表单中定义的标准操作;
  • 命令式API:执行需要JavaScript执行的复杂、更动态的互动。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第7张

这两种方式允许开发者为AI提供一套直接的工具集,让Agent跳过视觉识别,直接访问网站背后的结构化函数。

此前,谷歌软件工程师Khushal Sagar在演讲中表示,WebMCP的目标是成为AI应用领域的USB-C接口。

它不仅是让智能体替代用户,更是建立一种协作模式:

  • 用户、网页、智能体三者共享界面,共同协作;
  • 智能体专用路径:开发者在为人类设计UI的同时,为智能体提供结构化的API路径。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第8张

两大巨头联手

要彻底「干掉」前端?

值得一提的是,WebMCP并非谷歌的独角戏。早在去年8月,谷歌与微软开发者联手在GitHub上提交了这一项目。

WebMCP重塑AI与网页交互时代 WebMCP AI交互 网页革新 智能体 第9张"/>