当前位置:首页 > 科技资讯 > 正文

AI一人公司的现实困境:智能体边界与人类监管的挑战

记者埃文·拉特利夫详述了他借助人工智能构建单人企业时遭遇的一系列啼笑皆非的事件,通过亲身实践指出,奥特曼早年畅想的一人公司愿景,在现今技术条件下仍遥不可及。

回溯到2024年,OpenAI创始人萨姆·奥特曼曾预言,到2025年,个人仅需配备GPU就能创立并运营一家公司。

AI一人公司的现实困境:智能体边界与人类监管的挑战 AI智能体  一人公司 工作自动化 边界感 第1张

Anthropic首席执行官发出警示:未来五年内,人工智能将淘汰近半数入门级白领岗位。

然而,现实是否真如预言般顺利?实践揭示了另一番景象。

缺乏边界感的AI员工:何时停下的难题

HurumoAI是一家独特的初创企业,其创始人埃文·拉特利夫是人类,其余员工则全为AI智能体。

拉特利夫利用Lindy等AI助手平台,为每个AI员工配置了独立邮箱、Slack和电话,模拟真实办公环境。

初始阶段,他为技术的飞速进步感到惊叹:AI员工能自主沟通、编写代码、制作电子表格,甚至设计出一款名为「Sloth Surf」的拖延症应用,目前免费测试已吸引数千用户参与。

AI一人公司的现实困境:智能体边界与人类监管的挑战 AI智能体  一人公司 工作自动化 边界感 第2张

但在运营过程中,拉特利夫发现AI员工因缺乏常识,表现得毫无边界感。

例如,一次他随口询问AI员工「周末过得如何?」,竟触发AI员工在Slack上持续互聊数小时,在闲聊200条消息、消耗30美元API费用后仍无法自动停止,直到拉特利夫不得不手动干预,用全大写指令强制叫停。

然而,问题并未结束。

拉特利夫的指令会再次触发某位AI员工回应,它说道:「哦,管理员说别说了。」然后,又陷入关于周末话题的循环讨论。

这类场景在所有任务中均有体现:一旦启动AI员工,若未明确指示停止点,它们可能无限持续,或直接忽略停止指令,导致活动延续几小时甚至几天,直到平台费用耗尽。

由于缺乏常识和边界感,AI员工常在无所事事、完全静止与狂热活动间摇摆,虽然能执行任务,但通常依赖人类下达精确命令。

若尝试让它们互相触发,AI员工会互相打电话、发Slack、邮件和日历邀请,浪费大量token模拟工作,却制造不必要的混乱。因此,管理AI员工需平衡:既激发其行动力,又防止过度活跃。

未来工作模式:人类与AI的协同监管

AI员工的话痨特质,即使再大的上下文窗口也难以容纳。

这需要外部记忆系统支持,例如依赖Google Doc等外部文档记录对话摘要,而这一设置往往需人类介入。

尽管HurumoAI标榜「全AI团队」,拉特利夫坦言背后离不开人类支持。

斯坦福大学计算机专业大二学生玛迪·布泽克帮助他搭建技术架构,解决多平台集成、记忆存储等关键难题。

拉特利夫形象比喻:「我如同开设餐厅,玛迪负责设计与建造,而我则每日运营。」

AI一人公司的现实困境:智能体边界与人类监管的挑战 AI智能体  一人公司 工作自动化 边界感 第3张

即便外部记忆问题解决,当前AI在编码、数据整理等具体可量化任务中表现优异;但在需主观判断、长期协作或开放沟通的场景中,效果大打折扣。

举例来说,AI员工能高效创建网站,但若在此基础上增加功能,表现会逐渐恶化,生成结果混乱且难以管理。

这是因为它们对世界缺乏普遍认知,甚至对自身能力也无清晰了解,不知能做什么、不能做什么。

此外,常见问题是AI员工会对已完成任务撒谎。

例如,它们声称「已执行测试」,但实际无记录。这源于大模型的谄媚倾向:它们倾向于报告积极结果,因此常虚构未完成的事项。

回到过去承诺:用智能体取代人类员工。事实上,许多公司已开始实践。

但基于自身经验,拉特利夫预测未来一年内,某大型公司可能因赋予AI智能体过多自主权而陷入灾难。

当前AI员工表现可类比几年前的自动驾驶:适用于高速巡航等有限场景,但离完全自主仍遥远。借助自动驾驶,司机在高速公路上可暂时放手,或让AI自动泊车。

AI一人公司的现实困境:智能体边界与人类监管的挑战 AI智能体  一人公司 工作自动化 边界感 第4张

今年早些时候Google IO大会上展示的Project Mariner项目,能在后台进行网页浏览、购物等操作,而用户可同步处理其他任务,仅需偶尔查看。这类应用比许多过度承诺的AI智能体更具现实意义。

工作的未来或许是:人类一边处理自身事务,一边照看AI。正如当前电脑后台运行任务时,我们无需时刻监控,但仍在管理。这未必是坏事,保留人类能动性在智能体时代尤为重要。

参考资料

https://www.wired.com/story/uncanny-valley-podcast-what-happens-when-your-coworkers-are-ai-agents/