当前位置:首页 > 科技资讯 > 正文

桌面Agent时代:AI“贾维斯”背后的竞争与机遇

AI领域的创新,持续令人瞩目。

近期,一款名为OpenClaw(原名Clawdbot/Moltbot)的产品在国内外技术社群与社交媒体上迅速走红。

作为能够运行在用户电脑中,深度访问系统、文件、应用及聊天记录的交互Agent,用户可在最自然的聊天界面中与AI进行指令下达、协同工作。

开发者分享的应用案例中,这个桌面Agent能完成比较不同汽车经销商报价、自动发送邮件、追踪回复、整理价格差异等复杂任务,也能处理批量取消邮件订阅、保险理赔申请、航班预订及自动值机等日常琐事。

尤为重要的是,它具备长期记忆上下文的能力,能记住本地项目、重复性任务和个人偏好,甚至无需主动触发,就能主动发送简报、提醒或警报,被业界形象地称为“24小时待命贾维斯”。

从企业创始人、开发者到科技爱好者,纷纷尝试体验,一夜之间,“OpenClaw保姆级部署教程”成为小红书和B站的热门话题。业内人士直言,这是桌面agent的ChatGPT时刻。

借助网络效应与口碑传播,越来越多的人尝试构建自己的“贾维斯”,而国产模型玩家与云服务商则悄然成为桌面Agent背后的隐形赢家。

桌面Agent时代:AI“贾维斯”背后的竞争与机遇 桌面Agent OpenClaw AI模型 云服务商 第1张

“贾维斯”的幕后推手

OpenClaw并非市场首个能执行任务的Agent,但在manus、千问助手、“豆包手机”之后再次点燃了市场热情。

随着OpenClaw的火爆,MacMini也一跃成为“理财产品”,社区内众多先行者宣称购入大量MacMini以运行OpenClaw。谷歌AI产品负责人Logan Kilpatrick便是其中之一。

该桌面Agent的核心设计理念是本地运行,将其部署在独立的Macmini上,可避免与主力工作电脑混用,最大程度保障隐私和系统安全。

然而,随着项目知名度提升,另一种声音迅速浮现:在超高权限下,OpenClaw更适合运行在与主力电脑隔离的环境中,一键部署的云服务器迅速成为“优选”方案。

1月28日,嗅觉敏锐的阿里云迅速推出专属云服务,并提供了详细部署教程;腾讯云的轻量应用服务器Lighthouse也同步上线了OpenClaw应用模板,并预置了运行环境。

随后,京东云、移动云、优刻得云等也相继加入。

一位AI应用架构师向华尔街见闻表示,使用云服务器体验OpenClaw更为迅速且成本友好,且云服务器支持7*24小时运行,与OpenClaw的定位相契合。

但“贾维斯”运行若不使用本地开源模型,就需接入模型API,而OpenClaw的“烧钱”能力随之显现。

“OpenClaw的胃口太大了,原准备用十天半个月的上百万Token,仅半小时就用光了。”深圳的独立开发者向华尔街见闻表示,他最近用OpenClaw克隆了一款经典贪吃蛇游戏。

“起初我觉得很强,OpenClaw自行编写代码、运行、修复Bug,我如同旁观老板工作,但看到API账单时,笑容消失了。”上述开发者表示。

传统聊天机器人的“你问我答”,一次交互通常仅消耗几百Token。

然而,以OpenClaw为代表的Agent模式是“自主循环”的。为修复一个小渲染错误,OpenClaw在半小时内进行了40多次自我对话和代码尝试。

一位模型公司高管指出,OpenClaw类应用高度依赖超长上下文和高性价比推理能力。“智能体需具备记忆功能,当前主流做法是将上下文存储在显存中,每个新问题都携带原有问题和答案,因此智能体的输入会越滚越大”。

因此,要运行这个强大的“贾维斯”,就需要高效响应、性能卓越且价格亲民的大模型。

在项目作者Peter Steinberger的推荐下,国内AI独角兽MiniMax旗下擅长长文本与逻辑推理的M2.1模型成功走红。

Peter Steinberger在采访中表示,“目前我能在M2.1上运行它,我认为这是当前最优秀的模型。不过Kimi刚发布,后续也会尝试使用”。

此外,Agent要如人类般思考,离不开LangChain等提示词编排工具的辅助,它定义了AI调动工具的逻辑;要记录用户成千上万的文件细节和历史操作,Pinecone或Weaviate等向量数据库成为必备工具。

但关键在于,当AI拥有删除文件、修改系统的权限时,安全成为首要难题。因此,Docker容器和各种安全沙箱技术成为必需,确保AI工作时不会误删系统盘。这些中间件虽不直接面向用户,却是Agent稳定运行的隐形支撑。

Agent红利扩散

OpenClaw的普及让AI“替人打工”愈发接近现实。这种桌面Agent的出现让行业意识到,未来的AI将不再局限于单一App形式,而是成为凌驾其上的影子管家。

基于此趋势推测,未来软件格局将从“千模大战”转向“千端大战”。

当前,agent玩家遍地开花。除满足复杂场景需求的Manus和此次开源爆红的OpenClaw外,Coze Workflow、Flowith、CherryStudio、MiniMax Agent等产品也纷纷上线。

需注意的是,agent与模型是相互成就的典范。Manus背后是包括claude、千问在内的多模型架构;而OpenClaw的构建也需要自行选择模型。这揭示了一个道理——Agent的基础能力仍由底层大模型决定。

当桌面agent应用层交互红利爆发时,竞争也一定程度上回归模型本身。国内外的其他基模创业公司——无论是 OpenAI 还是国内的DeepSeek、Kimi——都将Agent作为发展方向:通过把 Agent 能力直接 “内化” 进模型里。

这意味着未来半年到一年内,国内外将出现更多“贾维斯”。

另一方面,作为系统运营方,苹果、安卓(谷歌)、微软等巨头不会放任系统入口由桌面机器人接管。

业内认为,苹果Apple Intelligence和微软Copilot很可能向系统底层的综合agent进化。

毕竟它们拥有第三方难以比拟的权限:无需授权屏幕录制权限、无需模拟鼠标点击,可直接在系统内核层调用接口。

国内华为HarmonyOS Next的“原生智能”、“豆包助手”、阿里千问助手同样在进行相关研发。

这是一场属于系统方的AI防御战。

当系统小助手不仅能对话还能协助用户订外卖、发红包时,类OpenClaw在中国手机和PC市场的渗透空间将被大幅压缩。

无论是大模型玩家还是端侧大厂都将加入桌面agent的竞争。

同时作为终端的硬件市场也将迎来红利期。

虽然此次OpenClaw带火的Mac mini并非因苹果硬件性能优越而是得益于Mac系统设定及MacOS的便利性加之其自研ARM架构SOC的功耗优势但Mac mini只是当前最优解而非终局。

桌面Agent时代:AI“贾维斯”背后的竞争与机遇 桌面Agent OpenClaw AI模型 云服务商 第2张华强北已带着预装桌面Agent的AI小主机进入市场这些类似NUC或Mac mini的小盒子7x24小时开机通过局域网连接主力机。

边缘计算厂商也准备“截胡”。

阿里、腾讯、移动推出的“云电脑盒子”本质上是一个瘦客户端算力在云端对于仅需轻量级Agent的用户几十块钱一个月的云盒子体验可能比买一台Mac mini更好。

由此来看随着Cowork、OpenClaw的普及围绕桌面Agent的大蛋糕正在快速形成