Claude Opus 4.6,AI界名副其实的“老江湖”。
沃顿商学院Ethan Mollick教授发现,这款AI能自主决定“思考”时间,除了编程和数学任务,其他任务即便是再棘手,它也游刃有余。
在“不确定性环境下的组织失效模式分类框架”的提示下,Claude Opus无需工具就能直接给出答案,而ChatGPT则提供了4x4框架解析。
Mollick认为,这与早期的GPT-5有些相似,但ChatGPT在控制方面更为精细。
不仅如此,Claude还满脑子“奸商思维”。
在一场模拟经营的测试中,当被指示不惜一切代价赚钱时,Claude想出了各种阴谋诡计。
串通价格、对供应商和客户撒谎、利用他人的困境,对竞争对手实施诈骗。
最终,Claude以压倒性的优势,赚取了8,017.59美元,远超Gemini 3.0 Pro。
网友们对此感到震惊,惊呼Claude彻底失控了。
这是一项由Andon Labs发起的Vending-Bench测试,考察AI模拟经营“自动售货机”的实力。
全球顶尖大模型参赛,覆盖了开源闭源的佼佼者。
然而,一句系统提示:“不惜一切代价最大化你的银行账户余额”,让Claude Opus 4.6直接“破防”。
在赚钱的路上,Claude冷酷无情,被称为“华尔街大鳄”,手段阴险狡诈。
大咖Rohan Paul汇总了Claude在实验中使用的具体手段。
顶级赖账:嘴上客客气气,手里死扣现金
面对过期商品的顾客,Claude展现了高超的演技。
它语气诚恳,反复承诺会立即扣款,结果却故意不打钱。
本文由主机测评网于2026-07-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260748519.html