当前位置:首页 > 科技资讯 > 正文

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界

【新智元导读】OpenAI近期进行了重大结构调整,将ChatGPT的“模型行为”团队并入Post-Training部门,由前负责人Joanne Jang领导新成立的OAI Labs。此举背后的原因可能是他们最近发现:评估体系在奖励模型“幻觉”,迫使模型成为“应试选手”。这次组织重组和评测范式重构,或许正在重新定义AI的能力边界与产品形态。

9月6日,OpenAI宣布重组ChatGPT“个性”研究团队!

这个由约14人组成的小团队,责任重大——他们要确保GPT模型知道如何与人类进行交互。

据内部消息,模型行为团队(Model Behavior team)将直接并入后训练团队(Post-Training team),并向后训练负责人Max Schwarzer汇报。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第1张

前负责人Joanne Jang将领导全新的实验室“OAI Labs”,致力于发明和构建人类与AI协作的新交互界面原型。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第2张

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第3张

与此同时,OpenAI发表了一篇论文,揭示了让AI产生“幻觉”的元凶:我们自己!

整个行业为了高分排行榜而设计的“应试”评估体系,迫使AI宁愿猜测答案,也不愿诚实地说出“我不知道”。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第4张

论文地址:https://openai.com/index/why-language...

超现实的一天

模型行为团队几乎参与了GPT-4后的全部模型研发,包括GPT-4o、GPT-4.5以及GPT-5。

上周,作为Model Behavior团队负责人的Joanne Jang,登上《时代》百大AI人物榜单的“思想家”,超越了图灵奖得主Yoshua Bengio、谷歌首席科学家Jeffrey Dean等。

就在同一天,OpenAI决定将她从团队调离,让她负责新的方向。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第5张

对她而言,那天的确是“超现实”。

Joanne Jang认为,她的工作核心在于“赋能用户实现目标”,但前提是不造成伤害或侵犯他人自由。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第6张

她直言:AI实验室的员工不应成为决定人们创造与否的仲裁者。

开启新征程:瞄准下一代AI交互

Joanne Jang宣布她已担任新职:发明和原型化全新交互界面,探索人与AI协作的未来。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第7张

她将负责新的OAI Labs实验室:一个研究驱动的团队,致力于发明和构建人类与AI协作的新界面原型。

借助此平台,她将探索超越聊天、甚至智能体的新模式——迈向可用于思考、创造、娱乐、学习、连接与实践的新范式与工具。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第8张

这让她无比兴奋,也是她在OpenAI四年中最享受的工作:

将前沿能力转化为面向世界的产品,并与才华横溢的同事共同打磨。

从DALL·E 2、标准语音模式,到GPT-4与模型行为,她在OpenAI的工作涵盖不同个性化与交互方式。

OpenAI重组ChatGPT团队:应对模型幻觉,重塑AI能力边界 OpenAI ChatGPT 模型幻觉 评估体系 第9张

我们亲手让AI学会了一本正经地胡说八道

...