当前位置:首页 > 科技资讯 > 正文

Manus模式:AI应用的“DeepSeek时刻”,开启8000万数字员工新时代

Manus模式:AI应用的“DeepSeek时刻”,开启8000万数字员工新时代 多智能体系统 AI应用 Manus 数字员工 第1张

截至目前,围绕Manus展开的公开探讨,大多未能深入其本质。即便在上周末,唐杰、杨植麟、林俊旸、姚顺雨这四位被誉为“基模四杰”的专家进行交流时,对于Manus的深远意义也仅是浅尝辄止,未作详细阐述。这背后或许有难言之隐——毕竟Manus正处于舆论漩涡中心,大家不便公开剖析。但如今,任何一场关于人工智能的深度对话,如果刻意回避Manus,其价值必将大打折扣。

维特根斯坦曾言:“凡是可以言说的,都可以说清楚。”Manus所代表的技术演进方向,恰恰属于能够清晰阐释的范畴——它绝非一次寻常的技术升级,而是AI应用领域的“DeepSeek时刻”,标志着人工智能从“内容生成”迈向了“自主执行任务”的范式革命。

正如当年DeepSeek的横空出世,大幅降低了开源大模型的应用门槛,让普通用户也能便捷地使用AI;Manus所构建的“多智能体系统”,通过大模型与虚拟机的精妙整合,直接将AI转化为能够独立处理复杂任务的数字生产力。无论是OpenAI、Anthropic,还是国内的DeepSeek、字节跳动,都在期待这样一个能够彻底诠释“AI应用”潜力的关键时刻。无论Manus未来如何发展,它探索出的这条AI应用路径,即便只是灵光乍现,也足以被赋予“伟大”的标签。

Manus模式的核心价值,可归纳为三点:

1. 它是人类历史上首家拥有超过8000万名“数字员工”的企业;

2. 其本质是一套“人工智能操作系统”;

3. 它所代表的技术模式终将全面落地,届时人类文明将实现0.5个级别的跃迁。

以上论断绝非夸大其词。接下来,AI行业将迎来继算力竞赛之后的又一场“囚徒困境”式博弈。从各类模型新锐,到BAT等传统巨头,再到Meta、字节、OpenAI、Anthropic和DeepSeek,无人能够置身事外。

01

Manus的“8000万名员工”

在Manus披露的核心数据中,外界往往聚焦于其年度经常性收入突破1亿美元,以及累计处理147万亿tokens的规模。然而,真正揭示其模式本质的指标是“创建超过8000万个虚拟计算机实例”——这一常被忽视的数字,恰恰是理解其颠覆性的关键。

与移动互联网时代对比,更能凸显其变革意义:移动互联网时代,云计算作为操作系统,支撑着数以亿计的虚拟机(即云服务器),而这些虚拟机均由人类操控。人类精英在这些虚拟机上构建了电商、社交、短视频等万亿级产业;而Manus模式则以编程语言为核心调度规则,整合Claude、GPT、千问等第三方先进大模型,在算力基础上搭建了8000万台由AI自主操作的“虚拟机”。每一台虚拟机都是一个独立的数字工作单元,可执行研究、开发、自动化处理等任务,本质上相当于8000万个功能各异的AI员工。

这标志着核心操作者的彻底转变:从人变为AI。支撑这一转变的Manus系统,正是AI的操作系统——多智能体系统。

进一步而言,Manus模式预示着人类将迎来一次“文明级”的生产力飞跃。首先,所有与数字经济相关的劳动岗位都可能被AI接管,这本身便相当于文明提升了0.5个级别;一旦算力更加充裕,AI员工从8000万扩展到8000万亿级别,其迸发的能量将彻底重构物理世界的所有生产工具。届时,具身智能体(人形机器人仅是其中一种)将在绝大多数领域取代人类,甚至取代现有自动化设备,从而实现一次完整的文明跃升。

02

AI应用的“DeepSeek时刻”

2024年初,Anthropic发布多智能体系统研究结果时,一组数据令整个行业为之一振:在多智能体架构下,Claude Opus处理复杂任务的性能相比单个智能体提升了90.2%。这组数据揭示了一个简单却深刻的道理:真正的智能从来不是孤立存在的。

深度学习兴起后,AI发展长期聚焦于“将单个模型做大做强”——堆叠更多参数、扩充训练数据、设计更复杂架构,仿佛这是实现AGI的唯一路径。例如GPT-4参数达1.8万亿,Gemini Ultra探索跨模态融合,Claude 3在长上下文理解上取得突破。然而现实是,这条路径已逼近边际效益递减的瓶颈。

多智能体系统另辟蹊径:不追求无所不能的“超级大脑”,而是构建分工明确、协同工作的“智能社会”。在Manus架构中,规划代理扮演战略家角色,负责理解用户需求、制定行动方案;执行代理如同专业工人,各自调用工具完成任务;验证代理则充当质检员,确保每个环节的准确性。这种分工带来了显著的效率提升。Anthropic的实验表明,处理需要并行推进、信息量超出单个模型上下文窗口的任务时,多智能体系统的表现比单智能体高出90.2%。更关键的是,95%的性能差异可归因于三个因素:token使用量(占80%)、工具调用次数和模型选择。换言之,多智能体通过合理分配任务、调度资源,实现了“1+1>2”的协同效应。

从理论层面看,AI发展可分为三个阶段:第一阶段是感知智能(如图像识别、语音识别);第二阶段是认知智能(如语言理解、逻辑推理);如今正迈入第三阶段——多智能体协作。多智能体的核心并非单个智能体的能力,而是协作能力。人类文明的飞跃正是从个体狩猎走向群体协作开始的。多智能体系统本质上是在数字世界重演这一进化历程:当多个AI能够像人类团队一样分工、协作、纠错、优化时,它们解决复杂问题的能力将发生质变。此前已有诸多单点突破证明了AI的实力:DeepSeek-Math在数学推理上超越人类选手,AutoGPT能独立完成复杂项目,Devinci的代码生成水平接近资深工程师。而多智能体系统要做的,正是将这些“专家”组织起来协同作业。这不仅是技术的简单升级,更是能力的指数级爆发。

在专门评估AI处理现实复杂任务的GAIA基准测试中,Manus在所有三个难度级别均斩获最佳成绩,分数超越OpenAI的DeepResearch,成为排名第一的AI助手。GAIA测试考察多步骤推理、外部工具调用、长远规划等能力,夺得榜首充分证明了Manus的硬实力。商业表现更具说服力:Manus推出不到一年,年度经常性收入便突破1亿美元,远超多数SaaS初创公司的同期表现。目前仍有250多万人在排队等待试用,其定价档次——39美元/月的基础版和199美元/月的专业版——也清晰勾勒出商业化路径。

这背后的逻辑很简单:当AI能真正代替人类完成从头到尾的复杂工作,而不再仅仅是辅助工具时,其商业价值便从“提升效率”跃升为“替代劳动力”。这标志着AI应用彻底告别“玩具”“助手”阶段,正式进入“工作者”阶段——这就是AI应用的“DeepSeek时刻”。

03

多智能体系统的几块技术基石

多智能体系统之所以具备如此强大的能力,并非凭空而来,而是依托多重核心技术:虚拟机提供的安全执行环境、算力池化实现的高效资源利用,以及智能编排保障的协同工作流。这些技术看似基础,甚至古老,却是将多智能体从理论转化为可靠产品的关键。

1. 虚拟机:AI的“独立工作车间”

Manus会为每个任务创建独立的云端虚拟机沙盒,这一设计解决了AI产业化的核心难题:安全性与可靠性。传统AI应用常遭遇“环境不兼容”的问题——生成的代码换个环境便无法运行,调用的工具与系统冲突,一个任务出错可能波及整个系统。虚拟机技术提供了完全隔离的执行环境,让每个任务在“干净”的环境中开始和结束,既保证了系统稳定,也使结果可重复验证。更重要的是数据安全:企业用户最担心敏感数据在AI处理时泄露或被污染。Manus的虚拟机架构采用四级安全防护:网络隔离防止数据跨任务流动,任务完成后沙盒直接销毁确保无数据残留,访问权限遵循“最少够用”原则,每个操作均留有审计记录。截至目前,Manus已创建超过8000万台独立虚拟机,这一数字不仅体现了其规模,更证明了架构的稳定性和可扩展性。从云计算视角看,这种模式极具颠覆性:虚拟机是云服务的核心产品,随着多智能体应用爆发,其需求必将大幅增长。而中国在云计算时代积累了深厚虚拟机技术的公司——如百度、阿里、深信服等——将在新的技术竞争周期迎来新的发展机遇。

2. 池化与编排:聪明的“资源管家”

多智能体系统的另一核心优势在于智能资源管理。Manus采用“分层推理”策略,根据任务难度动态匹配模型:简单任务调用Llama 3等轻量级开源模型,复杂任务则动用Claude 3.5等重型模型。这种精细化调度将单个任务的token消耗降至行业平均水平的1/3。池化技术的核心是打破“资源孤岛”:传统AI应用常为每个功能单独部署模型,导致资源浪费。Manus建立了统一的算力池和模型池,能够全局调度、动态分配资源。用户提交复杂任务时,系统不会让一个超大模型包揽所有工作,而是从池中调用多个合适的模型和工具,让它们各展所长、协同完成。智能编排系统则是多智能体的“指挥中枢”,需要解决一系列复杂问题:如何将大任务拆解为小任务?哪些小任务可并行?哪些必须顺序执行?算力不足时如何分配?任务出错如何处理?Manus的编排系统借助强化学习不断优化,分析了数千万次任务执行数据,持续改进任务拆分与资源分配算法。从Manus的技术博客可以看出,其背后拥有强大的工程化能力——例如上下文管理、稳定虚拟机环境搭建、外部应用集成等。这些看似“不核心”的工程问题,恰恰是多智能体系统能否稳定运行的关键。大模型的上下文窗口限制是一大难题,即便最新模型支持100万tokens,应对真正复杂的任务仍显不足。Manus采用了巧妙的上下文管理策略,仅将必要信息传递给每个智能体,既保证任务信息完整,又不浪费上下文空间。中国团队在工程实现上的优势在此体现得淋漓尽致:与硅谷公司侧重算法突破不同,中国工程师更擅长将先进技术转化为稳定可靠的产品。Manus的工程能力体现在诸多方面:支持10万+任务同时运行,复杂工作流可自动重试、寻找替代方案,响应时间稳定可预测。这些工程细节的打磨,是多智能体从“演示demo”走向“商业产品”的必经之路。

综上,Manus无疑是继DeepSeek之后最具突破性的AI公司。

04

下一场“囚徒困境”式AI战争

大厂必须跟进的原因可归结为三个维度:技术上,多智能体是大模型能力的“放大器”。单个大模型再强,处理复杂任务也有局限,多智能体通过协作能突破这一瓶颈,不跟进则自家大模型的应用价值将大打折扣;产品上,多智能体重塑了人机交互方式。从“人操作AI”到“AI自主完成任务”,这种转变将催生全新的产品形态,错过这一转变,可能如同诺基亚错过智能手机时代,从领导者沦为旁观者;生态上,多智能体平台可能成为新的生态中心。正如iOS和Android支撑起移动互联网生态,多智能体平台可能成为AI应用开发、部署和运行的基础,失去这一平台地位,便会在AI时代被边缘化。

从公开的专利、人员流动和技术路线图可见,全球科技巨头均在加速布局多智能体:国外方面,Meta不仅收购了Scale AI以增强数据能力,内部多智能体团队已将Llama系列模型与多智能体框架结合,在内部管理任务中实现30%的效率提升——尽管大模型本身表现平平,但Meta在认知层面的布局显然被低估;Google的Gemini项目本就包含多智能体协作思路,还公开了《AGENTS:多智能体语言模型系统开源框架》的核心架构;微软通过Azure AI提供多智能体开发工具,并将该能力集成到Office和Dynamic 365中,志在打造“企业数字员工平台”;亚马逊AWS Bedrock新增多智能体编排功能,让企业能基于多种大模型构建自有系统。国内市场同样热闹非凡:一年前,阿里千问团队便被传与Manus存在合作,计划打造适合中国市场的Agent系统;腾讯引入姚顺雨后,目标直指智能体能力;百度作为强化学习时代的先行者,在“智能体编排平台”技术领域积淀深厚,相关多智能体技术专利已于2025年内曝光;字节跳动动向虽显神秘,但2026年持续高强度提升算力水平,侧面折射出其在智能体应用上的巨大需求——豆包手机或许只是烟雾弹,正餐大概率是多智能体。与此同时,最值得期待的本土模型新势力当属月之暗面(Kimi),它早在半年前便已快速入局多智能体(OkComputer项目)。近期,该公司完成5亿美元C轮融资,由IDG资本领投,估值达30亿美元,资金主要用途之一便是“加强多智能体系统的研发和产品化”,目标是一年内实现1亿美元ARR,复制Manus的增长路径。若Kimi这一目标达成,将证明多智能体商业模式的可复制性,届时会有更多创业公司涌入,竞争将更趋白热化。当然,最重要的信号仍来自DeepSeek:多智能体系统的根基在于系统化AI编程能力——即AI的通用语言能力。当前全球最强的AI编程模型公司是Anthropic,基于此能力,Anthropic实则已超越OpenAI成为全球第一强的大模型公司。而据传春节前后DeepSeek将推出的新版本模型,即对标Anthropic的模型编程能力。一旦如此,中国AI多智能体应用将再无技术后顾之忧,中国AI应用的寒武纪大爆发将完全开启。

05

人类角色历史性转变:从操作者到管理者

多智能体系统带来的一个深刻变化,很容易被低估:编程语言正在成为AI之间的“通用语言”,而人类与AI的关系,正从“操作者-工具”演变为“管理者-团队”。观察Manus的工作过程会发现一个有趣现象:用户用自然语言下达指令,但AI之间沟通时,却大量使用结构化、精确的“类代码”语言。规划代理传递给执行代理的不是模糊描述,而是包含函数调用、参数设置、条件判断的“任务说明书”。这是效率的必然要求:自然语言虽表达丰富,但易有歧义,多个AI若要精准协作,模糊指令只会导致错误与低效。代码或类代码语言能够实现无歧义表达,确保每个AI清楚自身职责与标准。例如,用户要求“分析公司财报并提取关键财务指标”,规划代理不会直接将这句话转给执行代理,而是将其转换为一系列精确的操作指令。这种代码化的任务描述不仅精准,还可验证、调试、重复使用。这背后是人机协作方式的根本转变:人类不再纠结“怎么干”,只需说清“干什么”。

当AI能以代码级精度理解和执行创造性任务时,人类创造性劳动的内涵便发生了变化。传统的“创造性工作”中,实则隐藏着大量重复、模式化的内容:市场分析师收集数据、设计师调整布局、程序员调试代码、律师查阅案例。这些工作虽需专业知识,但本质上是常规执行。多智能体系统能自动化的,正是这部分“创造性工作里的执行环节”。短期内,它们不会取代人类的战略判断、审美选择和价值取向,但能将人类从繁琐执行中解放出来。这将带来两个结果:一是初级、中级创造性工作的需求可能减少;二是高阶创造性工作的价值将被放大。例如,AI能完成80%的常规设计任务,人类设计师便可专注于20%需要突破性创意的部分;AI能撰写标准法律文件,人类律师则能更专注于复杂案件的策略与法庭辩论。这不是职业消失,而是职业进化。就像计算机没有消灭会计师,只是将他们从手工记账中解放出来,转变为财务分析师和战略顾问一样,多智能体也将重塑每一个知识型职业。

生产力的飞跃必然带动生产关系的调整。多智能体带来的不仅是效率提升,更是组织方式的根本变革。传统企业的层级结构是围绕人类的能力限制设计的:需要管理层定战略、中层传指令、基层执行,因为信息传递和处理能力有限。而多智能体能瞬间完成从战略解析到任务执行的全过程,企业的层级将趋于扁平。更深刻的变革在于生产资料所有权的重新定义:工业时代的核心生产资料是机器,信息时代是数据和算法,而到了多智能体时代,“智能体团队”本身便成为核心生产资料。企业无需再雇佣大量人类员工组建团队,而是可以“租用”或“培养”AI智能体团队。这种转变已然开始:Manus的定价模式本质上就是“数字劳动力租赁服务”:39美元/月可同时运行2个任务,199美元/月可同时运行5个任务。对中小企业而言,这意味着无需雇佣全职团队即可获得专业能力;对大企业而言,则能灵活调整“数字员工”规模以应对业务波动。而生产关系变革中最大的挑战可能是分配问题——当AI创造大量价值,这些价值该如何在企业、用户和社会之间分配,目前尚无明确答案。

06

被低估的风险:数据主权与系统安全

在多智能体系统高歌猛进的背后,有两个核心要素被严重低估:数据和安全。它们如同数字世界的暗物质,无形却支撑着整个系统,一旦出现问题,可能从基石沦为致命弱点。传统AI中,数据主要是训练模型的“原料”——越多越好、越多样越好。Meta花143亿美元收购Scale AI 49%股份,便是遵循这一思路:通过高质量、大规模的标注数据提升模型性能。但在多智能体系统中,数据的角色彻底改变。在这里,数据不仅是训练原料,更是AI之间协作的“流通货币”,也是系统进化的“记忆载体”。每个任务执行过程中,规划代理的任务分解策略、执行代理的工具调用经验、验证代理的错误总结,都会以数据形式沉淀下来,成为系统的集体智慧。Manus据称通过联邦学习建立的“经验库”,已积累2000多个行业任务模板和千万级任务执行记录。这些并非原始训练数据,而是结构化、可复用的“工作记忆”。遇到相似任务时,系统无需从头推理,直接调用优化方案,效率最高可提升60%。

这种转变带来了新问题:数据的产权和价值分配变得模糊。用户的任务需求、系统生成的执行策略,究竟归属于谁?用这些数据优化系统、服务其他用户时,如何保障原用户的权益?行业目前尚未形成共识,但这是多智能体商业化必须解决的根本问题。还有一个隐性风险是数据质量的“马太效应”:优质用户(能提出清晰复杂需求的专家)产生的数据质量高,能使系统在相关领域持续优化,进而吸引更多优质用户,形成正向循环;而低质量数据则可能导致系统在某些场景下停滞甚至退化。这种分化可能加剧数字鸿沟,使多智能体成为少数人的“特权工具”。

单智能体的安全问题主要是“输入输出安全”,例如防止恶意提示、输出有害内容;但多智能体的安全挑战要复杂得多,涉及流程安全、协作安全和进化安全三个层面。流程安全是多智能体特有的问题:一个任务拆解为多个子任务由不同AI并行执行时,可能出现意想不到的风险。例如在财务分析任务中,“数据收集AI”不慎爬取敏感信息,“报告生成AI”又将这些信息写入最终报告,导致数据泄露。单独看每个AI的行为都合规,但组合起来便产生安全漏洞。Manus的虚拟机沙盒能提供基础隔离,但解决不了AI之间的语义级安全问题,因此它引入了“安全验证代理”,专门监控任务执行中的数据流和权限使用。但这会增加系统复杂度和成本——测试显示,完全的安全监控会使任务执行时间增加15%-30%。协作安全则更为微妙:AI之间需通过通信协调工作,这一通道可能被攻击者利用,实施“AI间攻击”。例如攻击者通过恶意提示控制“文件管理AI”,再让其向“数据发送AI”发送伪造指令,将敏感数据传出。这种两个授权AI之间的“合法”通信,传统安全防护很难检测。进化安全是最棘手的挑战:多智能体系统能通过学习不断优化,但如果学习数据中混入恶意信息或异常模式,系统可能会“学坏”。更危险的是,这种“学坏”是渐进的、难以察觉,不会突然作恶,而是慢慢在边缘场景出现偏差,最终在某个临界点爆发问题。Anthropic的研究显示,多智能体的安全风险与AI数量呈非线性增长:从单智能体增加到三智能体,已知攻击路径增加5倍;增加到五智能体,攻击路径增加23倍。这种复杂度的爆炸式增长,让传统的安全审计几乎失效。

数据与安全在多智能体系统中构成“不可分割的共同体”:更多优质数据能提升系统能力,但也会扩大攻击面;更强的安全措施能保障可靠性,但会限制数据流动和系统灵活性。目前行业正在探索差分隐私、同态加密、可信执行环境等技术解决方案。Manus的企业版已推出“隐私计算模块”,允许敏感数据在加密状态下被处理,AI只能获取结果,无法接触原始数据。但这会牺牲性能——加密状态下的计算速度可能下降40%-60%。更深层的问题在于安全与效率的根本权衡。绝对安全的系统可能效率极低,高效的系统又可能存在安全漏洞。多智能体需要在两者之间寻找动态平衡点,而这个平衡点会随应用场景、数据类型、风险承受能力而变化。这不仅是技术问题,更是治理和伦理问题。

07

多智能体的发展路径已不可逆

Manus的八千万台虚拟机,并非冰冷的数字,而是新型生产力时代的信号。每一台虚拟机都是一个潜在的“数字员工”,它们不知疲倦、可以无限复制、能瞬间协同,正在重新定义“工作”本身。多智能体系统的成熟,标志着AI从“替代人类特定技能”进入了“替代完整工作流”的阶段。但这种替代并非“机器取代人”的零和游戏,而是生产力关系的范式转移。历史有过类似的启示:ATM机的出现并未消灭银行柜员,反而改变了他们的工作性质。1985年到2005年,美国ATM机从10万台增至40万台,银行柜员数量却增加了10%。变化在于工作内容——柜员从处理现金交易,转变为提供金融服务和解决问题的顾问。

多智能体时代也将重演这种转变。当AI能处理常规的流程化创造性工作时,人类的角色将向三个方向进化:任务设计者(定义AI要解决的问题)、过程监督者(确保AI工作符合要求)、价值判断者(做出需要伦理考量、审美选择和战略权衡的决策)。站在当下展望未来,多智能体系统的发展路径已清晰可见:短期1-2年内,垂直领域的多智能体应用将爆发。金融、法律、医疗、教育等行业的专业Agent将大量涌现,它们不是通用AI的简化版,而是针对特定领域深度优化的专家系统。Manus的商业模式将被复制和改造,市场竞争异常激烈。中期3-5年内,多智能体系统将从“工具”进化为“平台”。正如iOS和Android支撑起移动应用生态,领先的多智能体架构将成为AI应用的基础设施。长期5-10年内,人机协作将进入“融合”阶段。人类与AI的界限将变得模糊,不是靠脑机接口等科幻技术,而是通过工作流程的深度整合。人类决策将融入AI的实时分析,AI执行将吸纳人类的即时反馈。届时,工作不再是“人做的”或“机器做的”,而是人机系统共同完成的。

Manus的八千万虚拟员工,本质上是人类协作智慧的数字镜像。人类文明的进步,从来不是靠个体智能的飞跃,而是依靠协作方式的革新——语言、文字、印刷术、互联网,每一次媒介革命都扩大了协作的规模和效率。多智能体系统正是这一进程的又一次里程碑式延伸。它第一次让机器具备了真正的协作能力——不是简单的任务并行,而是基于共同目标、分工协调、相互纠错的有机协作。当机器学会协作,它们带来的不仅是效率提升,更是全新的可能性。但这种可能性也伴随着深刻挑战。当AI能自主协作完成复杂任务时,传统的责任框架、监管模式、伦理准则都需要重新思考:谁为多智能体的集体决策负责?如何确保它们的协作符合人类价值观?如何在享受协作红利的同时防范系统性风险?这些问题没有简单答案,但它们定义了多智能体时代的核心议程。Manus和它的八千万虚拟员工只是序幕,真正的故事才刚刚开始。在这场人类文明的历史性重构中,技术是推动力,但人类的智慧、伦理和远见,才是决定方向的终极力量。

本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。