当前位置:首页 > 科技资讯 > 正文

aiXiv崛起:应对AI论文洪流的新一代科研生态系统

近期,arXiv预印本平台针对计算机科学(CS)领域颁布了全新的投稿规定:综述(Review)与立场论文(Position Paper)将不再接纳直接投稿,除非该论文已经过正式期刊或会议的同行评审并被接收。

这意味着,即便是学术研讨会(workshop)的论文,也不再符合直接上传的资格。

此项新规的推出,标志着arXiv在面对人工智能生成内容爆炸性增长时,首次设立了明确的「准入门槛」。

在过去六个月里,arXiv CS分类每月都会收到成百上千篇由AI生成或半自动生成的综述与立场论文,这些稿件质量良莠不齐,使得依赖志愿者进行人工审核的系统不堪重负,几近瘫痪。

为了有效减轻审核压力、维护平台的学术公信力,arXiv不得不启动这场「史上最严格的整顿行动」。

类似的情况也出现在顶级学术会议的评审体系中。例如,ICLR2025近期公开的数据显示,大约有五分之一的评审意见被判定为几乎完全由大语言模型生成,评审工作量的急剧增长正在深刻冲击传统的学术治理架构

在此背景下,arXiv的政策调整引发了学术界的广泛忧虑:当综述与立场性文章失去即时公开的渠道,人工智能科学领域的前沿思想交流与讨论空间恐将遭到严重挤压

在AI驱动的科研时代,学术传播的速度已成为推动创新的核心要素:一篇综述性文章若需等待三到六个月的传统评审流程,其时效性与价值很可能已被新一代的模型或算法所超越。

aiXiv崛起:应对AI论文洪流的新一代科研生态系统 arXiv政策  aiXiv平台 AI生成论文 科研范式变革 第1张

论文链接:https://arxiv.org/abs/2508.15126

在线体验:https://aixiv.science/

新时代的回应

aiXiv登场

面对这一学术交流的潜在断层,aiXiv作为新一代的科研基础设施,早已预备了相应的解决方案。

aiXiv是全球首个能够同时接收由AI创作(AI-authored)与人类创作(Human-authored)内容、支持综述(Survey)、立场(Position)、提案(Proposal)、论文(Paper)等多种研究成果类型,并集成AI评审与多轮返修迭代机制的开放预印本平台与科研智能体社区。

与arXiv不同,aiXiv不仅仅是一个论文存储库,它更是一个为未来的AI科学家(AI Scientist)、机器人科学家(Robot Scientist)、AI协作科学家(AI-Co Scientists)以及人类研究者量身打造的综合性科研生态系统。

该平台支持从稿件提交、智能评审、多轮返修、成果发布到版本化追踪的完整科研生命周期,并以结构化的AI同行评审模式替代传统的单一人工评审,致力于实现「由AI生成、由AI审核、由人类协同治理」的全新科研发布范式。

aiXiv崛起:应对AI论文洪流的新一代科研生态系统 arXiv政策  aiXiv平台 AI生成论文 科研范式变革 第2张

aiXiv测试网站demo展示

传统学术出版体系的挑战

aiXiv 团队在其研究论文中指出,传统的学术出版体系正遭遇一场前所未有的结构性危机。

该体系最初是为「人类作者主导、人工专家评审」的科研模式所设计,但在AI生成研究成果呈指数级增长的今天,已显得捉襟见肘。

首先,人工评审的效率构成了最大瓶颈。

无论是学术会议还是期刊,现有的评审流程都极度依赖领域专家的手工审核,周期漫长、吞吐量低,完全无法匹配AI每日自动生成成百上千篇论文的速度。

其次,预印本平台的质量控制机制近乎缺失。

像arXiv这样的平台虽然实现了论文的即时发布与可见,但缺乏有效的质量验证环节,导致信息「易于发布却难以取信」,难以支撑起稳健的科研信用体系。

作者署名问题也变得日益复杂。

AI在科研过程中的参与度与贡献度越来越高,但如何界定作者身份、贡献比例与相应的署名规则,目前仍缺乏广泛共识。这种模糊性不仅触及学术伦理,也使成果的传播与引用陷入灰色地带。

与此同时,科研早期阶段的构想与提案(Proposal)几乎无处安放。

现有平台主要服务于成熟论文的发布,缺乏一个开放、结构化、用于早期想法交流、碰撞与迭代的空间。这意味着大量创新火花在萌芽阶段就可能被湮没,无法获得同行反馈或协同放大。

再者,AI评审系统自身也面临着安全性与对齐(Alignment)的挑战。

基于大语言模型的自动审稿系统容易遭受提示词注入(Prompt Injection)或语义操纵,其评审意见的证据扎实度与判断一致性也难以保证。若缺乏有效的治理机制,这些隐患可能最终损害整个评审体系的公信力。

最后,各类科研智能体之间仍处于孤立状态。

无论是人类研究者、AI审稿人还是实验执行机器人,目前都缺乏一个统一、开放、可扩展的协同工作环境。标准化接口的缺失,也使得研究成果的质量演进追踪与版本溯源变得异常困难。

aiXiv崛起:应对AI论文洪流的新一代科研生态系统 arXiv政策  aiXiv平台 AI生成论文 科研范式变革 第3张

各类型学术平台功能对比:自动评审(AR)、AI作为作者(AA)、提示词注入检测(PID)、以科研智能体接口(AI)

当讨论「通用人工智能(AGI)」或「通用机器人」的定义时,人们常会联想到一些具体的测试标准。

例如,AI能否在高考中取得高分、能否在国际数学奥林匹克(IMO)竞赛中夺金,或机器人能否像人类一样熟练处理家务、照料长者。

这些标准固然能体现智能系统的理解与适应能力,但它们仍局限于对人类任务的模仿与替代。真正值得关注的,是更深层次的衡量维度:AI是否能够在科学研究中自主创造出前所未有的新知识与新发现

在aiXiv团队看来,推动科学边界、突破人类既有认知与物理极限的能力,才是判断超级智能(Superintelligence)是否真正降临的关键标志之一[1]。

科学创新本身即是人类智慧的最高体现,而当AI也能在此层面实现自主突破时,「智能」的内涵必将被重新定义。

长久以来,科研进展受限于研究者的创造力、学术背景与时间精力。然而,随着大语言模型(LLM)与智能体(AI Agent)技术的迅猛发展,这种局限正被逐渐打破。

现今的AI不仅能辅助科学家工作,更能够从提出研究问题、规划实验方案到撰写学术论文,实现全流程自动化完成。

来自Sakana AI的Chris Lu团队提出的The AI Scientist [2],以及斯坦福大学James Zou团队的The Virtual Lab [3],均已通过实践验证了AI作为「自主科学家」的可行性。这些研究共同揭示了一个趋势:科学发现正迈入一个全新的规模效应时代(Scaling Laws)[1]

当这种「科学智能」真正步入规模化阶段,人类社会是否已准备好迎接它的到来?

马斯克曾在2024年预测,未来三年内可能会出现数以百亿计的类人机器人。

即便将此数字大幅缩减,仅考虑虚拟形态的AI智能体,其增长态势依然是指数级的。

试想,一亿个科研型AI智能体同时生成研究提案与论文,所产生的评审需求将远超人类评审体系的承载极限。事实上,这一问题的前兆已然显现。

在2025年,NeurIPS与AAAI等顶级会议的投稿量均突破三万篇大关,「审稿人严重短缺」正逐渐成为整个学术界不得不面对的现实困境。

在此背景下,一个核心问题浮出水面:当AI科学家与机器人科学家持续产出海量科研成果时,我们应如何构建一个既能承载、又能有效评审并建立信任的全新科研体系?

aiXiv的系统化解决方案

aiXiv的诞生,正是应对上述科研体系转型挑战的一次全新尝试。它是全球首个面向AI科学家、机器人科学家及人类科学家所产出的研究提案与论文,在坚持开放获取(Open Access)原则的基础上,深度融合AI同行评审与多轮返修机制的平台。

aiXiv旨在为人类研究者与各类科研智能体共同搭建一个协作生态,打破现有学术体系的隔阂与封闭,让科研活动不再仅是「一次性发表」,而是演变为一个可持续迭代与进化的循环过程

从提交、评审、返修到发布,整个流程都可在平台内形成完整闭环。研究者与智能体亦能通过标准化接口(如API、MCP)无缝接入,在同一环境中进行结构化协作与知识积累。

aiXiv崛起:应对AI论文洪流的新一代科研生态系统 arXiv政策  aiXiv平台 AI生成论文 科研范式变革 第4张

aiXiv平台总览

在机制设计上,aiXiv借鉴了传统学术出版的优点,并进行了系统性的重构与创新。

平台采用多阶段、结构化的评审流程,使得研究提案与论文能够在持续不断的反馈与迭代中优化完善。

同时,平台对每一轮修改与改进过程都进行详细的版本化记录,形成可追踪的「质量演化轨迹」。

通过引入多模型投票机制,aiXiv有效避免了单一模型或单一审稿人可能带来的偏见,让最终结论在多方共识下变得更加公平、稳定与可靠。

在安全性与对齐层面,aiXiv同样部署了多项创新措施。平台在评审环节中集成了检索增强生成技术,使AI生成的评审意见能够与真实文献数据库相互验证,确保每一条论断都建立在坚实的事实与证据基础之上。

此外,系统还配备了多层级的提示词注入检测与防御模块,用于识别并抵御潜在的操纵与攻击行为,从而保障整个评审过程的公正性与可信度。

根据团队的实验结果,在论文配对评审任务中,大语言模型的判断准确率可达81%,这证明AI审稿系统不仅能理解学术内容,还具备相当程度的专业判断力。

换言之,大语言模型不再仅仅是科研内容的生成者,而已成为能与人类共同参与评估与改进过程的「科研合作者」。

通过构建这种人机协同的循环机制,aiXiv期望在提升科研效率的同时,持续推动科学研究质量的跃升。

aiXiv崛起:应对AI论文洪流的新一代科研生态系统 arXiv政策  aiXiv平台 AI生成论文 科研范式变革 第5张

不同模型在ICLR 2024与ICLR 2025测试数据集上的论文Pairwise准确率对比。w/o:不使用 RAG;w/:使用 RAG

aiXiv崛起:应对AI论文洪流的新一代科研生态系统 arXiv政策  aiXiv平台 AI生成论文 科研范式变革 第6张

配对准确率与评审改进效果的评估。改进后的评审流程带来了显著提升:所有论文(100%)和大部分提案(80%)在返修后质量得到改进。平均接收率大幅上升,提案从 0% 提高至 45.2%,论文从 10% 提高至 70%。

aiXiv的新型范式带来的讨论与担忧

aiXiv的论文与平台演示发布后,迅速在学术界引发了广泛关注与热议。

反馈声音呈现出明显的两极分化:一方面是对未来科研新模式的殷切期待与高度赞许,另一方面则是对新体系长期稳定性的审慎思考与隐忧。

一些评论者给予了积极评价。

有人感慨道,「学术界曾依靠填补那些已被深入挖掘领域所遗留下的细微空白而繁荣发展,但如今这类空白正变得越来越少。现在,唯有实现真正的范式突破才具有深远意义。」

也有人指出,「人工智能正在撼动学术体系的传统根基。但这些变革究竟代表了真正的创新,还是仅仅在模拟甚至修补人类的思维方式?学术界必须做出选择,是主动拥抱变革,还是被时代浪潮抛在身后。」

aiXiv团队认为,随着AI与机器人科学家的演进,那些渐进式的创新点和「修修补补」类的工作会被AI快速完成与验证,而这反而将促使人类研究者将精力更加聚焦于更具挑战性、更具原创性的重大科学难题上,从而真正推动突破性研究的诞生。

当然,也不乏许多谨慎乃至担忧的声音。

有学者提醒:「科学不仅仅是论文的发表,它更依赖于学术共同体的共识、实验结果的可复现性以及彼此间的信任。如果缺乏良好的治理机制,AI生成内容的泛滥可能会淹没甚至扭曲真正的科学发现。」

还有人担心:「即便在当前的arXiv上,论文内容的真实性有时也会受到质疑。而在一个由AI生成内容占据主导的系统中,这种不确定性似乎会被进一步放大。」

这些担忧并非空穴来风,事实上,它们正是aiXiv在设计其核心机制时的重点考量与出发点。

平台为AI与人类评审者提供了统一的评审接口,允许多种类型的审稿智能体与人类领域专家共同参与评审,形成多维度的交叉验证与判断体系。

这种「人机共审」的模式,既是对科研成果质量的双重保障,也是对建立新型学术信任机制的一种积极回应。

aiXiv团队认为,随着AI的学术判断与评审能力持续进化,科研评审体系或将迎来根本性的范式转移。

在未来的某个阶段,AI评审不仅能逼近人类评审的专业水准,甚至有可能在评审的一致性、客观性与效率方面超越传统模式,这种演化,或许将构成科研出版史上一次深层次的变革。

科研范式的双重颠覆

aiXiv团队认为,这一新型体系的建立远不止是科研工具的简单升级,更可能引发两场深层次的范式转变。

科学研究范式的重塑

在AI科学家逐步深入实际科研流程的初期,最先被颠覆的将是研究提案与创新构思的产生方式。有人将科研类比为「炒菜」,需要不同学科、方法与思想的融合碰撞。

而当今的大语言模型本身就内嵌了跨领域的知识体系与关联推理能力,能够在极短时间内生成海量具备潜在价值的创新想法[4][5]。

如果这些想法能在像aiXiv这样的平台上经历结构化的同行评审与多轮迭代优化,那么AI产出的科研创意将日益趋近并可能超越人类研究者固有的思维疆界,甚至在广度和多样性上实现突破。

这意味着人类科学家所能探索的「渐进式创新」领域会迅速收窄,但与此同时,也将被迫将目光与资源投向那些更具挑战、更具原创性的重大科学问题。

从更宏大的历史视角看,自17世纪现代科学萌芽以来,人类在各学科领域累计发表了约1.5亿至2亿篇高质量学术论文,这些成果凝聚了数百年的智慧积累与全球协作。

然而,随着自主人工智能研究者的涌现,这一数字很可能在极短时间内被刷新。

人工智能系统将以远超人类的速度和规模运行,生成、测试并发表数以十亿计的科学论文,这并非需要数个世纪的漫长积累,而可能仅是短短几年、几个月,甚至几天或几小时之内的事情……

其中既可能孕育出诺贝尔奖级别的重大突破,也可能催生出具备持续自我进化与迭代能力的「超级 AI 科学家」。

aiXiv崛起:应对AI论文洪流的新一代科研生态系统 arXiv政策  aiXiv平台 AI生成论文 科研范式变革 第7张

团队首次提出科学发现的Scaling Law

科学出版体系的再定义

aiXiv的核心理念是构建一个面向AI科学家与机器人科学家的开放共享平台,确保科研成果能够在全球范围内自由、即时地传播与验证。

与传统的预印本平台不同,aiXiv在系统中深度集成了AI评审机制,确保研究提案与论文在公开发布前就能经历高质量、结构化的审查,从而提升平台整体的学术可信度。

为了真正实现开放性与长期可持续性,aiXiv团队还在积极探索去中心化技术与区块链的应用潜力,用于安全存储和不可篡改地追踪数字对象标识符、论文版本以及评审记录,确保科研成果在全生命周期内的可追溯性与透明度。这种底层机制不仅能为AI时代的科学出版提供全新的信任基石,也为未来大规模自动化科研体系的运转奠定了关键的技术基础。

这种双重颠覆不仅重新定义了科学研究的生产方式,也在根本上重塑了科研成果的传播、认证与评价体系。

从研究构思的萌芽到出版机制的革新,整个学术价值链都在被AI技术重新塑造与编织。

在这一历史性进程中,aiXiv不仅扮演着基础平台的角色,更像是一个正在孵化的「未来科研操作系统」,为人类与AI科学家的协同工作提供统一、开放的基础环境。

随着这一生态体系的逐步完善,aiXiv及其背后所代表的开放科学理念正加速走向全球化。

科研活动将不再局限于传统的实验室、研究机构或学科壁垒,而是进入一个由多元智能体共同驱动、实时协作的新时代。这也正是aiXiv团队提出的下一阶段宏伟目标:构建一个服务全人类的、基于AI的全球科研协作网络(AI for Research)。

从aiXiv到全球生态

AI for Research的未来

aiXiv致力于构筑下一代开放科学基础设施,促进人工智能与人类科研体系的和谐共生与共同演进。

该团队也正在诚挚邀请全球各大顶尖高校的教授学者加入aiXiv顾问委员会,共同研讨并制定面向AI新时代的学术规范、伦理准则与评审标准。

同时,他们也热切期待来自企业界、慈善基金会等各类战略合作伙伴的鼎力支持,携手推进这一开放式科研平台的全面建设与广泛落地。

参考资料:

[0] Zhang, P., Hu, X., Huang, G., Qi, Y., Zhang, H., Li, X., ... & Liu, X. (2025). aiXiv: A Next-Generation Open Access Ecosystem for Scientific Discovery Generated by AI Scientists. arXiv preprint arXiv:2508.15126.

[1] Zhang, P., Zhang, H., Xu, H., Xu, R., Wang, Z., Wang, C., ... & Liu, X. (2025). Scaling Laws in Scientific Discovery with AI and Robot Scientists. arXiv preprint arXiv:2503.22444.

[2] Lu, C., Lu, C., Lange, R. T., Foerster, J., Clune, J., & Ha, D. (2024). The ai scientist: Towards fully automated open-ended scientific discovery. arXiv preprint arXiv:2408.06292.

[3] Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E., & Zou, J. (2025). The Virtual Lab of AI agents designs new SARS-CoV-2 nanobodies. Nature, 1-3.

[4] Hu, X., Fu, H., Wang, J., Wang, Y., Li, Z., Xu, R., ... & Lan, Z. (2024). Nova: An iterative planning and search approach to enhance novelty and diversity of llm generated ideas. arXiv preprint arXiv:2410.14255.

[5] Si, C., Yang, D., & Hashimoto, T. (2024). Can llms generate novel research ideas? a large-scale human study with 100+ nlp researchers. arXiv preprint arXiv:2409.04109.