DeepSeek近日宣布,计划于2025年第四季度推出一款能够执行多步骤任务并具备自我改进能力的人工智能代理(AI Agent)系统。
与此同时,公司发布了一份数据来源与安全说明,明确警告“幻觉”问题目前无法根除,并承认AI的准确性仍有局限性。
首先,DeepSeek正在推进其R1推理模型的“代理化”升级版本,该模型在今年一月曾引起市场轰动。新系统的目标是能够独立完成多步骤任务,最大限度地减少人工干预,并能根据以往行为进行自我调整。这正是代理系统的核心优势所在。
其次,DeepSeek公开了训练数据的筛选方法,排除了仇恨言论、色情内容、暴力、垃圾信息以及可能侵权的材料,并坦率表示“幻觉”问题目前尚无解决方案。
AI Agent(人工智能代理)已成为大模型领域的下一个关键战场。
OpenAI于七月推出了ChatGPT代理,能够浏览网页、登录系统并跨工具执行任务;微软在五月为Copilot增加了多代理协同功能,并扩展了代理SDK;Anthropic则发布了代理指南,并推出了面向企业的“计算机使用”功能。
这些系统虽不完美,但正变得越来越实用。
国内厂商也在加速布局。阿里巴巴的Qwen团队在代理框架和界面自动化研究方面表现激进;腾讯等公司则将代理功能集成到用户日常服务中。
由中国人创立、总部现位于新加坡的Manus,凭借推广“通用AI代理”处理复杂工作流,引发了全球关注和政策审查。
显然,AI Agent已不再是实验性项目,而是大模型的核心主赛道。
相比之下,DeepSeek自R1发布后行动较为谨慎。国内媒体报道称,R2时间表延迟是因为创始人梁文锋追求完美,也有人认为是普通工程延误。押注单一但更强大的代理系统,而非频繁推出过渡版本,是一种高风险策略。
如果DeepSeek成功,将会产生什么影响?
首先是工作流程的变革。
可靠的代理系统能够规划、点击、撰写和修改,相当于将五个应用程序整合为一个自动化流程。查询旅游信息、审核报销单、寻找供应商、处理基础IT工单——这些脑力劳动都可以转化为“配方式”操作。延迟、工具使用准确性和权限管理将决定实际应用的范围。
其次是价格的影响。
DeepSeek的崛起挑战了“只有巨额资金才能获胜”的训练预算观念。如果它能以低成本推出高自主性的代理,将迫使企业重新定义价值:不仅看模型质量,还要看每美元、每分钟的任务完成效率。这将冲击云服务利润、软件捆绑模式以及厂商“AI赋能”的宣传方式。
最后是地缘政治的影响。
出口管制限制了中国获取顶级GPU,迫使企业追求效率而非盲目扩张规模。如果DeepSeek的代理表现出色,华盛顿和布鲁塞尔会将其视为证据:管制虽能减缓技术发展,但无法阻止其扩散。预计将有更多呼吁要求对代理系统的认证、交易和行为审计设立限制。
AI Agent正在将竞争焦点从模型评分转向任务完成度、可靠性和成本,重塑企业评估“AI价值”的方式。
DeepSeek的双重策略——AI Agent的雄心与坦率的安全披露——考验的是稳健的工程能力和监管务实性,能否在标准化竞赛中击败快节奏发布的其他竞争对手。
成功则将一鸣惊人,失败则可能被市场远远甩开。
本文由主机测评网于2025-12-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20251213616.html