在技术的世界里,较真者总能揭示出令人震惊的真相。
2026年的到来,并没有让一切乱象停止,反而有科研人员决定站出来,对抗行业中的不正之风。
这一次,矛头指向了AI学术界的假开源现象。
这些论文在发表时宣称开源,还贴心地附上了GitHub链接,但后续却再无动静。
一位匿名AI研究员,以NeurIPS 2024为例,深入调查了这些论文的开源情况。结果发现,4035篇论文中,仅有2404篇真正实现了开源。
除了未提供链接的1533篇外,有98篇论文虽然声称开源并给出了链接,但点进去却发现代码仓库要么烂尾,要么仍在建设中。
这一发现不仅震撼了业界,也引发了广泛讨论。
据称,这位研究员在多次遭遇空仓库后,终于决定采取行动。
他回顾了NeurIPS 2024的论文,发现那些标记为“Coming Soon”的项目,大多最终都未能兑现。
他仅用一晚就开发出了爬取代码仓库的系统。
这位研究员指出,在Agentic AI时代,核查学术诚信的成本正迅速降低,谁脚踏实地,谁投机取巧,大数据之下无所遁形。
系统融合了OpenReview/GitHub API及PDF解析技术,从论文PDF中查地址,再逐一验证链接的有效性。
当然,他也承认系统可能存在误判,统计结果仅供参考。
数据显示,各机构的论文录用数量、真实开源数量、未标明链接文章数及假开源数一目了然。
更惊人的是,有98份明确承诺开源的代码地址,实际却为空仓库。
面对此景,只能说学术界需要更多的诚信与责任。
审稿制度的压力是主要原因之一。
自2021年起,NeurIPS等顶级会议要求填写可复现性检查表(Reproducibility Checklist)。
2024年的要求更为严格,需详细说明无法开源的理由。这些因素直接影响论文评分。
在此背景下,“愿意开源”几乎成了录用的潜规则。于是,“Coming Soon”便多了起来。
当然,现实可能更为复杂。
工业界论文需经过漫长合规流程才能发布代码;高门槛项目难以复现;课题组转向或专利问题也可能导致代码无法放出。
“没时间”永远不是违背承诺的借口。若无力开源,便不该在论文中画饼。
菜不是原罪;但当贪欲超出了能力的边界,迫使你献祭学术道德来换取虚名时,这就是罪。
我不是针对谁,只想给圈子提个醒。
AI领域飞速发展,但科研诚信或许是最该坚守的底线。
尽管这一行动可能打击面太具体,但希望AI研究能越来越好。
本文由主机测评网于2026-06-23发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260648259.html