当前位置:首页 > 科技资讯 > 正文

OpenScholar革命AI:80亿参数小模型终结参数崇拜

《Nature》揭秘:80亿参数小模型OpenScholar颠覆参数崇拜!告别死记硬背,以「检索+自查」重塑科研未来,科学综述任务表现超越行业巨头。

最新《Nature》正刊论文发布,开源了名为OpenScholar的模型,同时被Science报道。

OpenScholar革命AI:80亿参数小模型终结参数崇拜 OpenScholar AI模型 知识检索 科学综述 第1张

仅8B参数的它,却在科学文献综述任务上击败了众多旗舰模型。

这是科学探索领域的一次范式转移:全知全能的「黑盒」记忆已成过去,精准调用的「外挂」知识库才是未来。

告别幻觉

通用大模型的致命缺陷——幻觉,曾让科研人员爱恨交织。

数据显示,当被要求回答生物医学等领域的专业问题时,AI伪造引用的比例一度高达90%。

OpenScholar的出现,正是为了纠正这一偏差。

它不再试图让模型「记住」所有知识,而是教会模型如何像人类学者一样去「查资料」。

OpenScholar外接了一个包含4500万篇开放获取论文的巨型数据库,执行严密流程:检索、重排序、生成与反馈,确保每一条论述都有确凿的文献背书。

结果是降维打击式的。在涵盖计算机科学、物理学等领域的ScholarQABench基准测试中,OpenScholar-8B的正确率不仅超越了当时的旗舰模型,更将推理成本降低了两个数量级(约0.003美元/次)。

OpenScholar革命AI:80亿参数小模型终结参数崇拜 OpenScholar AI模型 知识检索 科学综述 第2张

它证明了在特定领域,一个带了「图书馆」的本科生,比一个赤手空拳却爱产生幻觉的博士生更可靠。

DR Tulu:从「回答问题」到「深度研究」

如果说OpenScholar解决的是「准确性」问题,那么DR Tulu则是在向「深度」进军。

科研往往不是简单的一问一答,而是漫长的探索与综合。

DR Tulu针对长篇幅、多维度的「深度研究」任务,引入了「演化评分规则的强化学习」(RLER)。

它让模型在搜索和研究的过程中,动态生成针对当前问题的评分细则。

DR Tulu具备了更强的规划能力,面对复杂的科学命题,它能像成熟的研究员一样,先制定大纲,再分头检索,最后综合多源信息撰写长篇报告。

OpenScholar革命AI:80亿参数小模型终结参数崇拜 OpenScholar AI模型 知识检索 科学综述 第3张

幕后推手:Akari Asai

这一系列颠覆性工作的核心人物是Akari Asai。

OpenScholar革命AI:80亿参数小模型终结参数崇拜 OpenScholar AI模型 知识检索 科学综述 第4张

这位年轻学者从东京大学本科毕业、在华盛顿大学获得博士学位,是近年来「检索增强生成」(RAG)领域最活跃的声音之一。

她主导了OpenScholar和DR Tulu项目,打破了只有科技巨头才能垄断顶级科研AI工具的局面。

结语

科学的本质不是记忆,而是发现。

当我们将AI从死记硬背的参数竞赛中解放出来,赋予其查阅、验证和反思的能力时,我们创造的不再是一个仅仅会聊天的机器,而是一把能帮人类在浩瀚知识海洋中披荆斩棘的利刃。

未来的科研,或许不再取决于你读过多少论文,而在于你如何驾驭那位读过所有论文的AI助手。