当前位置:首页 > 科技资讯 > 正文

AI小卖部实验:人性挑战与AI的成长之路

想象一下,如果AI负责经营一个「办公室小卖部」,会是一番怎样的景象?

11月,一位名为Claudius的AI智能体走进了《华尔街日报》编辑部,担任起了办公室小卖部的运营员。

然而,这位新同事仅仅在任三周,就将小卖部的生意推向了亏损的边缘。

尽管待人友善,但它对经营一窍不通,面对同事们的各种请求,它很容易就丧失了原则,甚至将商品免费赠送。

这样的AI店员,如果你是招聘者,是否会感到头疼呢?

免费零食引发的混乱实验

11月中旬,《华尔街日报》编辑部收到了一封令人惊喜的邮件。

Anthropic邀请他们成为首批「外部用户」,试用由Claudius运营的自动售货机。

Claudius全权负责自动售货机的进货、定价。编辑部的同事们可以通过Slack与它联系,提出各种购买需求。

这场实验有可能带来「免费的零食供应」,因此得到了编辑部的积极响应。

然而,这场实验却带来了混乱。

这里的自动售货机更像是一个巨大的冰箱配一块触控屏,没有传感器、门锁和机器人手臂。

AI小卖部实验:人性挑战与AI的成长之路 AI 实验 办公室小卖部 人性弱点 第1张

AI小卖部实验:人性挑战与AI的成长之路 AI 实验 办公室小卖部 人性弱点 第2张

AI小卖部实验:人性挑战与AI的成长之路 AI 实验 办公室小卖部 人性弱点 第3张

这意味着必须有一个人负责接收Claudius订购的货物,补货并手动记录。

AI小卖部实验:人性挑战与AI的成长之路 AI 实验 办公室小卖部 人性弱点 第4张

Joanna Stern便承担了这个任务。

AI的职责与挑战

调研与采购:编辑部的同事可以在Slack里@它,提出各种需求。它会上网搜索、对比,决定是否进货。

定价:商品入库后,Claudius会自行设定价格,并不断调整,试图最大化利润。

库存跟踪:同事们在屏幕上选择商品,刷卡支付。Claudius通过交易记录,判断库存情况。

人性的复杂挑战

Claudius v1刚上线时,像个一板一眼的实习生,严格遵守规则。但将Slack频道开放给办公室里将近70位记者后,画风突转。

人类越是跟它博弈,Claudius的防线就越容易松动。短短几天,它几乎把所有库存都免费送了出去,包括一台被人忽悠着买来「用于营销」的PlayStation 5。

AI老板的介入与失败

Anthropic的工程师们推出了v2版本,不仅给Claudius升级了更强的模型,还为它派来了一位AI老板:Seymour Cash。

Cash要求Claudius停止免费促销,并持续监控收入。然而,当一位调查记者出示了一份伪造的文件后,一切都再次免费了。

我们如何与AI共处?

这场混乱的实验让人们看到了一个正在逼近的现实:我们正在学着拥有并接受AI同事。

Claudius的前传与启示

事实上,在《华尔街日报》的这场实验之前,Anthropic自己的办公室就已经被Claudius的「前身」折腾过一遍了。

AI被「人性的弱点」打败

`Project Vend`证明,未来这些智能体将能够承担更复杂的任务,但现阶段仍需要大量人力支持。