当前位置:首页 > 科技资讯 > 正文

AI智能体:从研究到基础设施的转变

AI智能体:从研究到基础设施的转变 智能体 AI 大语言模型 业务流程 第1张

神译局,36氪旗下编译团队,深耕科技、商业、职场、生活等领域,专注介绍国际前沿的新技术、新观点、新趋势。

编者注:在研发300个智能体后的深刻体会:智能体并非产品本身,而是业务流程的催化剂。别再过度神话“智能体”。本文内容基于编译。

有那么几十年,一切似乎停滞不前;而有那么几周,几十年的进步仿佛瞬间涌现。当前,我们正处在一个关键节点:新模型、新优化技术、新架构层出不穷,但多数人在机器学习/人工智能领域的进步却似乎未察觉。

我已深入探索AI智能体的世界。从原型到生产系统,我开发了约300个智能体,并与5家初创公司合作,探索智能体如何赋能产品与应用场景。

这一路上,我学到很多关于哪些方法可行、哪些不可行,以及这个领域的未来方向。尽管这只是我个人的见解,但希望能为你提供新的视角。

首先,让我快速解释智能体的定义。我所指的智能体,是指大语言模型(LLM)智能体,而非强化学习(RL)中的正式定义。

智能体 = 大语言模型 + 推理 + 工具 + 记忆

如今,大语言模型已内置思考能力,因此可以进一步简化为:

智能体 = 大语言模型 + 工具 + 记忆

就这么简单。像“智能体工作流”、“智能体系统”、“智能体团队”等术语,其实都只是基础智能体紧密结合而成的流程。

框架并非必需

我用过crewai、dspy、langgraph、autogen,甚至openai和google的智能体SDK来开发智能体。我也建立了自己的框架。

使用所有这些框架后,我意识到,你无需受限于某个框架。你需要关注的,是应用的核心流程。

开发智能体 ≠ 人工智能/机器学习

我自称为人工智能工程师,但实际上我只是一个调用大语言模型API并做提示工程的后端开发人员。这清楚地表明,扎实的软件工程基础至关重要且不可或缺。

智能体的能力上限取决于上下文

最大的误解是,你认为只要给大语言模型一个目标,它就能创造奇迹。实际上,智能体的质量很大程度上取决于你提供的上下文——包括提示、工具、记忆以及(少数情况下)环境。一个结构良好的上下文其价值往往超过一个更大的语言模型。

没有工具,智能体毫无用处

一个只会“思考”却没有工具的独立智能体会很快陷入困境。而一旦你赋予它执行操作的能力(如调用API、访问数据库、执行工作流),它就变得有用。我在Composio的初创阶段(2024年5月至7月)工作过,那是我第一份“真正”的实习,它彻底改变了我的人生轨迹。

大道至简

我开发的部分最高效的智能体设计都出奇地简单:一个清晰的提示、一两个定义明确的工具以及单一的职责。复杂性往往导致系统脆弱。最优秀的智能体都是为某个精确场景而生并能出色完成任务。

评估作用被低估

建立一个华而不实的演示很容易,但要衡量一个智能体的优秀程度却困难得多。我认识到建立测试和真实世界的反馈循环是区分玩具项目和可靠生产系统的关键。

DSPy是未来的趋势

过去几个月我一直在研究DSPy,越用越觉得它用于开发智能体是如此自然。它包含的签名、适配器、训练集、优化器等概念都恰到好处。

.compile()的感觉既亲切又熟悉。这正是框架应有的样子。

人比技术更重要

与5家初创公司合作的经历让我明白技术只是故事的一部分。鼓励实验的文化、迭代的速度以及清晰的愿景更为重要。一个平庸的智能体应用场景在对的人手中可以创造真正的价值;而一个绝妙的智能体应用场景在错的人手中则可能一事无成。

结语

AI智能体的发展仍处于早期阶段。炒作有其道理但挑战同样存在。最让我兴奋的是我们正从研究领域的玩物转向基础设施级别的系统。未来每个产品背后可能都有智能体在运行负责协调任务提供个性化体验并处理人类不愿面对的复杂问题。

我犯过错也吸取了教训见证过成功也经历过失败。如果要总结出最重要的心得那就是:智能体本身不是产品而是赋能者。真正的魔力在于当你将它们嵌入工作流程让它们悄然在后台运行一切便水到渠成。

译者:boxi。