当前位置:首页 > 科技资讯 > 正文

AI研究员揭秘:假开源背后的真相

在技术的世界里,较真者总能揭示出令人震惊的真相。

2026年的到来,并没有让一切乱象停止,反而有科研人员决定站出来,对抗行业中的不正之风。

这一次,矛头指向了AI学术界的假开源现象。

这些论文在发表时宣称开源,还贴心地附上了GitHub链接,但后续却再无动静。

一位匿名AI研究员,以NeurIPS 2024为例,深入调查了这些论文的开源情况。结果发现,4035篇论文中,仅有2404篇真正实现了开源。

除了未提供链接的1533篇外,有98篇论文虽然声称开源并给出了链接,但点进去却发现代码仓库要么烂尾,要么仍在建设中。

AI研究员揭秘:假开源背后的真相 AI 假开源 科研诚信 NeurIPS 第1张

这一发现不仅震撼了业界,也引发了广泛讨论。

据称,这位研究员在多次遭遇空仓库后,终于决定采取行动。

他回顾了NeurIPS 2024的论文,发现那些标记为“Coming Soon”的项目,大多最终都未能兑现。

AI研究员揭秘:假开源背后的真相 AI 假开源 科研诚信 NeurIPS 第2张

他仅用一晚就开发出了爬取代码仓库的系统。

这位研究员指出,在Agentic AI时代,核查学术诚信的成本正迅速降低,谁脚踏实地,谁投机取巧,大数据之下无所遁形

系统融合了OpenReview/GitHub API及PDF解析技术,从论文PDF中查地址,再逐一验证链接的有效性。

当然,他也承认系统可能存在误判,统计结果仅供参考。

数据显示,各机构的论文录用数量、真实开源数量、未标明链接文章数及假开源数一目了然。

AI研究员揭秘:假开源背后的真相 AI 假开源 科研诚信 NeurIPS 第3张

更惊人的是,有98份明确承诺开源的代码地址,实际却为空仓库。

AI研究员揭秘:假开源背后的真相 AI 假开源 科研诚信 NeurIPS 第4张

面对此景,只能说学术界需要更多的诚信与责任。

假开源背后的原因

审稿制度的压力是主要原因之一。

自2021年起,NeurIPS等顶级会议要求填写可复现性检查表(Reproducibility Checklist)。

2024年的要求更为严格,需详细说明无法开源的理由。这些因素直接影响论文评分。

在此背景下,“愿意开源”几乎成了录用的潜规则。于是,“Coming Soon”便多了起来。

AI研究员揭秘:假开源背后的真相 AI 假开源 科研诚信 NeurIPS 第5张

当然,现实可能更为复杂。

工业界论文需经过漫长合规流程才能发布代码;高门槛项目难以复现;课题组转向或专利问题也可能导致代码无法放出。

AI研究员揭秘:假开源背后的真相 AI 假开源 科研诚信 NeurIPS 第6张

AI研究员揭秘:假开源背后的真相 AI 假开源 科研诚信 NeurIPS 第7张

One More Thing

“没时间”永远不是违背承诺的借口。若无力开源,便不该在论文中画饼。

菜不是原罪;但当贪欲超出了能力的边界,迫使你献祭学术道德来换取虚名时,这就是罪。

我不是针对谁,只想给圈子提个醒。

AI领域飞速发展,但科研诚信或许是最该坚守的底线。

尽管这一行动可能打击面太具体,但希望AI研究能越来越好。