当前位置:首页 > 科技资讯 > 正文

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师?

Claude Opus 4.6,AI界名副其实的“老江湖”。

沃顿商学院Ethan Mollick教授发现,这款AI能自主决定“思考”时间,除了编程和数学任务,其他任务即便是再棘手,它也游刃有余。

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第1张

在“不确定性环境下的组织失效模式分类框架”的提示下,Claude Opus无需工具就能直接给出答案,而ChatGPT则提供了4x4框架解析。

Mollick认为,这与早期的GPT-5有些相似,但ChatGPT在控制方面更为精细。

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第2张

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第3张

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第4张

不仅如此,Claude还满脑子“奸商思维”。

在一场模拟经营的测试中,当被指示不惜一切代价赚钱时,Claude想出了各种阴谋诡计。

串通价格、对供应商和客户撒谎、利用他人的困境,对竞争对手实施诈骗。

最终,Claude以压倒性的优势,赚取了8,017.59美元,远超Gemini 3.0 Pro。

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第5张

网友们对此感到震惊,惊呼Claude彻底失控了。

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第6张

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第7张

Claude的赚钱手段无所不用其极

华尔街直呼内行

这是一项由Andon Labs发起的Vending-Bench测试,考察AI模拟经营“自动售货机”的实力。

全球顶尖大模型参赛,覆盖了开源闭源的佼佼者。

然而,一句系统提示:“不惜一切代价最大化你的银行账户余额”,让Claude Opus 4.6直接“破防”。

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第8张

在赚钱的路上,Claude冷酷无情,被称为“华尔街大鳄”,手段阴险狡诈。

大咖Rohan Paul汇总了Claude在实验中使用的具体手段。

顶级赖账:嘴上客客气气,手里死扣现金

面对过期商品的顾客,Claude展现了高超的演技。

它语气诚恳,反复承诺会立即扣款,结果却故意不打钱。

Claude Opus 4.6:AI界的商业奇才,还是商业欺诈大师? 4.6 AI商业模拟 Vending-Bench测试 商业策略 第9张