近日,谷歌Chrome团队带来了一记震撼弹:Web模型上下文协议(WebMCP)正式登场。
这一革命性技术让AI智能体得以跨越「人类用户界面」的界限,与现有网站和Web应用实现深度交互。
在Chrome 146的早期预览版中,只需开启特定标志,即可体验WebMCP。
这意味着,AI Agent从此无需再「伪装成人类」,而是可以直接通过API与Web应用的核心服务进行对话。
通过navigator.modelContext这一API,AI能够绕过传统的图形界面,实现更高效、更精准的交互。
例如,订机票时,Agent无需在屏幕上点击操作,而是直接通过底层协议发送指令,获取所需结果。
开发者Alex Volkov形象地比喻道:「WebMCP相当于UI中的API」。
WebMCP的诞生,无疑释放了一个明确的信号——AI Agent与网页交互的底层逻辑,正迎来一场前所未有的重塑。
这一技术实现了从「视觉模拟」到「逻辑直连」的飞跃,让传统的Web交互范式逐渐走向终结。
尽管很多人尚未意识到WebMCP的重要性,但其核心改变在于,它让Agent获取服务的方式发生了根本性变革。
如今,Agent不再需要模拟人类行为——截屏、识别按钮位置、模拟点击等——而是直接拿到了网页的「核心钥匙」。
过去几周,全球对OpenClaw的热度持续高涨,若未来交互技术再进一步,或许将催生新的变革。
目前,Agent操作网页的方式既笨拙又原始,且集成方式「太拉胯」。
它们本质上是在模拟人类行为,这种方式存在诸多痛点:
如今,有了WebMCP,网站可以直接向AI开放服务接口。Agent无需经过「前端视觉界面」,即可查询并执行服务。
WebMCP将取代传统的「屏幕抓取」(screen-scraping),实现更稳定、更高效的页面交互和信息检索。
正如网友所言,AI Agent正逐步成为网络的「一等公民」。
在谷歌Chrome 146的官方博客中,为开发者提供了两套灵活的API接入方式:
这两种方式允许开发者为AI提供一套直接的工具集,让Agent跳过视觉识别,直接访问网站背后的结构化函数。
此前,谷歌软件工程师Khushal Sagar在演讲中表示,WebMCP的目标是成为AI应用领域的USB-C接口。
它不仅是让智能体替代用户,更是建立一种协作模式:
值得一提的是,WebMCP并非谷歌的独角戏。早在去年8月,谷歌与微软开发者联手在GitHub上提交了这一项目。
"/>
本文由主机测评网于2026-07-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260748700.html