NeurIPS 2025最佳论文震撼发布!四篇顶尖论文中,华人学者独占鳌头,何恺明、孙剑等人开创性成果获「时间检验奖」,实至名归。
NeurIPS 2025年度最佳论文榜单揭晓!
今年,NeurIPS组委会权威公布了本年度「最佳论文」获奖名单,共有四篇顶尖论文脱颖而出。
此外,还有三篇佳作荣获亚军(Runners Up)奖项。这七篇获奖论文覆盖了多个前沿领域:
扩散模型理论、自监督强化学习、注意力机制、大型语言模型的推理能力、在线学习理论、神经缩放律,以及评估语言模型多样性的基准方法。
值得一提的是,本年度「时间检验奖」特别颁给了《Faster R-CNN》这篇经典论文,由任少卿、何恺明、Ross Gisshick及孙剑共同创作。
今年恰逢NeurIPS第39届年会,与往年不同,NeurIPS 2025创新性地采用双城会议模式,分别在圣地亚哥与墨西哥城举行:
圣地亚哥:12月2日至7日,于圣地亚哥会议中心;
墨西哥城:11月30日至12月5日。
当前,正值墨西哥城分会召开之际,最佳论文名单也应运而生。
让我们一同见证这些AI领域的杰出贡献者荣获殊荣!
作者:Liwei Jiang, Yuanjun Chai, Margaret Li, Mickel Liu, Raymond Fok, Nouha Dziri, Yulia Tsvetkov, Maarten Sap, Yejin Choi
机构:华盛顿大学,卡内基梅隆大学,艾伦人工智能研究院,Lila Sciences,斯坦福大学
论文链接:[点击这里](https://openreview.net/forum?id=saDOrrnNTz)
大型语言模型在生成多样化、类人创造性内容时显得力不从心,引发了人们对长期接触同质化输出可能导致人类思维趋同的担忧。
然而,目前针对可扩展的语言模型输出多样性的评估方法仍存在不足,特别是在超越随机生成等狭窄任务或单一模型重复采样的场景下更为突出。
为了填补这一空白,来自华盛顿大学等机构的研究人员推出了大规模数据集Infinity-Chat。
Infinity-Chat包含两万六千条真实世界的开放式用户查询,这些查询允许多元合理答案共存,不存在唯一标准解。
这是首次提出了针对语言模型开放式提示的完整分类体系,包含六大顶层类别(如创意内容生成、头脑风暴与构思)及其下的十七个子类别。
通过Infinity-Chat,研究人员对语言模型的生成模式进行了大规模研究,发现开放式生成中存在显著的「人工蜂群思维效应」,具体表现为:
该数据集还包含三万一千二百五十条人类标注数据,涵盖绝对评分与两两偏好比较,每个示例均获得二十五位标注者的独立评判,为研究开放式查询中群体与个体偏好提供了可能。
研究显示,最先进的语言模型、奖励模型与评判器在面对引发标注者个体偏好的模型生成结果时,虽然保持整体质量相当,却难以校准人类评分。
总体而言,Infinity-Chat是首个系统研究现实世界开放式大型语言模型查询的大规模资源,为缓解人工蜂群思维带来的长期AI安全风险提供了关键洞见。
本文由主机测评网于2026-05-14发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260545166.html