【导读】OpenAI首席执行官萨姆·奥特曼兴奋转发!这被视为AI最深远的变革,预示着科学从资源有限走向丰饶时代的来临。
令OpenAI奥特曼振奋的AI里程碑!
「AI科学家」Kosmos实现7项重大发现:
独立复现了神经科学、材料科学、生物学等领域的3项关键成果,
并在遗传流行病学、多组学整合分析、阿尔茨海默症和转录组学上取得4项原创突破。
奥特曼激动地表示:「我预期类似事件将日益增多,而这将成为AI最重要的影响之一。祝贺Future House团队!」
这项突破的背后,OpenAI功不可没——
Future House董事兼首席执行官Sam Rodriques在推文中评论:
这一切的实现,很大程度上归功于OpenAI团队的卓越贡献。
持续前行,未来几年必将更加精彩。
他还推广了Kosmos体验平台。
奥特曼祝贺的「未来之家」(Future House)有何来头?它做了什么让奥特曼如此兴奋?
可以肯定,这次奥特曼并未「眩晕瘫坐」。但无疑,这让他真切看到了「AI加速科学」的ASI曙光!
前沿科学正从「稀缺」转向「丰饶」。人类知识呈指数级增长,但人脑容量却停滞不前。
因此,新发现常被遗漏,潜在联系无人洞察。
要推动科学进步,人类亟需一种能与数据增长同步、能在全人类知识库中推理的智能体。
2023年,非营利组织FutureHouse成立,旨在打造一位加速创新的AI科学家。
「未来之家」的使命简洁:为每位科研人员配备一位AI科学家,让跨领域发现加速实现。
「未来之家」堪称全球第一AI科学家天团,可不断查阅资料,验证生化环材等领域的博士级想法;在2.5个月内,该平台找到了治盲新药,震撼医学界。
本月初,FutureHouse的商业分支——爱迪生(Edison),正将这项技术推向全球。
FutureHouse继续专注于基础生物学研究和教育普及,
而Edison(爱迪生)则将AI科学家技术扩展至全球研究人员和各行各业。
Edison由来自物理、生物、化学和人工智能等顶尖机构的科学家与工程师共同打造。
Edison将继续秉持FutureHouse理念,为科研社区提供丰厚的免费服务,同时为需要更高请求速率或额外功能的深度用户提供付费选项。
Kosmos是FutureHouse上一代AI科学家Robin的重大升级。
首先,Kosmos与许多AI工具截然不同。它不是聊天机器人,更像一款「深度科研工具」:需要一定的学习与调试时间,尤其在提示词设计上。
Edison团队强调,Kosmos并非闲聊式「娱乐」工具,而是类似「试剂盒」的科研工具,适合高价值研究任务。
因此,Kosmos定价较高,但学术用户可享免费额度。
作为下一代AI科学家,Kosmos的核心突破在于引入了结构化世界模型。
它能高效整合数百条智能体轨迹中的信息,在千万级token文本中保持研究目标的一致性与连贯性。
此前如Robin等AI科学家,难以处理大规模信息。受限于大语言模型上下文长度,AI科学家在推理路径上「走不远」,无法完成复杂发现。
而一次完整的Kosmos运行,能阅读1500篇论文,执行42,000行分析代码,其能力远超已知任何智能体。
正因如此,Kosmos相比Robin具备更强大的分析能力。
据Beta测试用户反馈,Kosmos能在一天内完成原本需六个月的工作,且结论准确率高达79.4%。
这个「六个月」的等效时长起初令人震惊!
虽然Kosmos常生成相当于数月人力的成果,但它有时也会误入歧途——比如钻入统计显著但科学意义不大的方向。因此,多次运行Kosmos可探索不同路径。
在Kosmos开发中,最惊人发现是:完整运行一次Kosmos,相当于博士生或博士后约六个月的工作量。
更有趣的是,开发团队发现这一「人类等效时间」随运行深度线性增长。
这成为首个与「科研任务复杂度」相关的推理时间缩放定律。
起初,开发团队半信半疑,因此专门验证——
他们邀请Beta测试用户提供研究目标,代为运行Kosmos。然后将结果发回,请用户估算:若无Kosmos,完成发现需多长时间?
在7位科学家反馈中,20步深度的Kosmos运行平均等效6.14个月研究工时。
他们对浅层运行也进行类似评估,并使用盲测控制,最终得出了技术报告中的缩放定律曲线。
尽管「人类节省时间」估算具主观性,开发团队仍认为Kosmos的工作包确实等同于科学家数月研究时间,原因有二:
一是「独立复现」的客观对照验证。
在技术报告中,他们展示Kosmos的三项发现,实际上已被人类科学家独立完成,但在运行Kosmos时:
有两项未发表,
另一项虽发布,但时间晚于Kosmos模型训练数据截止日期,
他们还确保Kosmos无法访问这些文献或相关研究。
即便如此,Kosmos在一次运行中成功复现了这些核心发现,而根据原作者记录,人类完成这些发现通常需数月。
当然,时间存在不确定性(如研究人员投入度),但相比基于主观问卷的「用户反馈法」,这种「已有成果对照法」更客观,支持Kosmos工作成果达「数月级」。
二是「计算工时」的独立估算模型。
他们还构建了更量化评估模型:假设科学家平均阅读一篇论文需15分钟,执行一次完整数据分析路径约2小时(与METR对当前AI智能体在软件工程任务中的估算一致)。
据此统计,Kosmos在一次平均运行中阅读的论文数量与分析路径总和,换算为人类科研时间约4.1个月(按每周40小时工作制计算)。
在OpenAI宣布「千亿美元股改」直播中,奥特曼阐述OpenAI的「科学家愿景」:
到2026年9月,打造一位实习级别的研究助理AI;
到2028年,实现一位全自动的「真正AI科学家」。
如果Kosmos的自动研究已达「月级别时长」,它是否已是OpenAI的「实习级别的研究助理AI」?
如果Kosmos已做到,OpenAI2026年的目标还有何难度?
难怪奥特曼发推表示激动。
而且在技术报告中,Kosmos已在生物、化学、材料科学等学科中发现新结果。
Kosmos报告中的所有结论均配有明确出处——要么引用原始文献,要么标明生成结论的代码位置,确保推理链条完全可溯源。
经独立科学家验证,Kosmos报告中79.4%的陈述准确。
技术报告详细列出了Kosmos的七项科研发现。
其中三项是对人类科学家此前成果的独立复现。
第一项发现:Kosmos利用代谢组学数据,复现了一篇未发表手稿的核心结论——在低温条件下,小鼠大脑中核苷酸代谢是变化最显著的通路。
关键是,在Kosmos完成运行后,这项研究的预印本才在BioRxiv发布。即AI和人类几乎同时独立发现了相同结果。
第二项发现:Kosmos成功复现了一篇预印本的关键观点,而该预印本发布时间晚于其所用大语言模型(LLM)的训练数据截止日期,且Kosmos运行时未访问该文献。
这一发现出自材料科学领域,表明Kosmos具备跨学科研究能力。
具体来说,Kosmos再现了结论:在热退火过程中,绝对湿度是决定钙钛矿太阳能电池效率的主导因素,关键阈值约60g/m³——一旦湿度超过此值,器件将彻底失效。
第三项发现:Kosmos与Piazza等人研究报告结论一致——跨物种的神经元连接模式可由一套通用数学规则描述。
预印本链接:https://www.biorxiv.org/content/10.1101/2025.02.27.640551v1
需说明的是,虽然Kosmos运行时未访问该研究,但该文预印本发布时间早于模型训练数据截止日期,无法完全排除训练中接触的可能。
除了上述「复现性发现」,Kosmos还独立作出四项原创科学贡献。
第四项发现:Kosmos结合公开GWAS(全基因组关联分析)与pQTL(蛋白质数量性状位点)数据,进行孟德尔随机化分析,提供统计学证据支持:血液中超氧化物歧化酶2(SOD2)浓度升高可能因果性地降低心肌T1时间,并减少心肌纤维化风险。
尽管该机制在小鼠中已有研究,但这一发现进一步证实了其在人类中的潜在意义。
第五项发现:Kosmos基于多组学和统计遗传学公开数据,提出了一个全新分子机制,解释某一单核苷酸多态性(SNP)如何可能降低2型糖尿病患病风险。
第六项发现:Kosmos创新设计了一种新型分析方法,利用阿尔茨海默病(AD)患者蛋白质组数据,推演出导致神经元中Tau蛋白积聚的分子事件序列。
第七项发现,具备明确临床相关性。
在「衰老过程中神经元易损性」开放性课题中,Kosmos对年轻与年老小鼠单细胞核转录组数据进行大规模、无偏探索,发现内嗅皮层神经元(AD中最早出现Tau蛋白积累的区域)随年龄增长,其flippase(翻转酶)基因表达水平显著下降。
该下降可能导致磷脂酰丝氨酸暴露于细胞膜表面,向小胶质细胞释放「吃掉我」信号,从而诱发免疫吞噬反应,导致神经元退化。
更关键的是,在另一组人类AD患者单细胞RNA测序数据中验证了这一发现。在Braak病理阶段II样本中,内嗅皮层上颗粒层神经元中flippase表达量明显低于Braak 0阶段(即尚未出现病理变化阶段),与Tau病变首次出现时间点完全吻合。
从独立复现到原创发现,Kosmos标志着AI科研能力进入可验证、可复用新阶段。
自动化科学正在形成,科研模式正迎来结构性变化。
参考资料:
https://edisonscientific.com/articles/announcing-kosmos
本文由主机测评网于2026-01-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260120865.html