智东西7月31日报道,第63届计算语言学协会年会(ACL 2025)在奥地利召开,此次会议吸引了超过8300篇投稿,中国大陆科研团队取得显著突破。
作为自然语言处理领域的顶级学术会议,ACL共评选出4篇最佳论文,其中2篇来自中国大陆,分别由北大与DeepSeek、华盛顿大学联合团队及北大-灵初智能联合实验室摘得。
DeepSeek等机构的获奖论文聚焦于原生稀疏注意力(NSA)机制,由袁境阳提出,目前在北京大学攻读博士学位。该机制实现了训练与推理阶段的显著速度提升,尤其在解码阶段达到了11.6倍的提升。
论文链接:
北大-灵初智能联合实验室的获奖论文揭示了模型参数结构中的弹性机制,可能引发后训练阶段的抗拒对齐行为,对AI治理和安全问题具有深远影响。
论文链接:
其余两篇最佳论文分别来自美国和德国,探讨了算法公平性和大型语言模型在自主决策中的采样偏差问题。
论文链接:
论文链接: 数据显示,2025年ACL投稿论文中,中国大陆科研人员的比例显著增长,达到多个重要指标的第一。此外,本届会议还见证了华人AI研究者的集体崛起,其中多篇杰出论文的第一作者为华人。 北大、DeepSeek与华盛顿大学联合团队的研究聚焦于原生稀疏注意力机制,该机制通过动态分层策略实现高效计算,提升了解码速度。 传统注意力机制计算开销大,而稀疏注意力方法通过选择性计算关键查询键对来减少开销。联合团队解决了现有稀疏注意力的两大问题,并在多个测试任务中证明了NSA机制的高效性与优越性。 北大-灵初智能联合实验室的研究揭示了语言模型在训练与对齐过程中的弹性机制。该机制使得模型倾向于回到原始分布,对抗对齐过程。研究从信息论角度分析了这一现象,并提出了开源策略的思考。 本届ACL不仅见证了华人AI研究者的杰出表现,还凸显了安全议题的重要性。随着华人AI研究者学术影响力的不断扩大,未来有望在全球AI研究中发挥更加重要的作用。
第一篇获奖论文:DeepSeek联手北大,NSA机制引领模型解码速度提升
第二篇获奖论文:北大-灵初智能团队探索模型对齐困境
结语:华人AI研究者集体崛起,安全成为ACL热点议题
本文由主机测评网于2026-04-19发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260438710.html