当前位置:首页 > 科技资讯 > 正文

LabOS:AI协研科学家引领人类与机器智能协同进化新纪元

人工智能在阅读海量学术论文后,是否能够真正动手进行实验?LabOS平台的诞生,标志着AI不仅拥有逻辑思考能力,更能“观察”、“指导”并“操控”真实实验过程,一个人类与机器智能共同演进的全新科学探索时代,正在悄然拉开帷幕。

在一个看似平常的生物实验室内,研究人员借助XR智能眼镜获得实时引导,镜片上浮现提示信息:“干细胞培养阶段已完成,请进行取样操作。” 紧接着,机器人自动接管了他手中的试管,启动涡旋混合器完成混合步骤。当科学家取回细胞样本时,视野中已同步展示出CRISPR基因编辑技术的下一步操作流程。

这一切背后的核心指挥者,正是具备实验室场景“世界模型”的AI协研科学家——LabOS。它如同一位洞察全局的指挥家,以多模态数据为乐谱,精准调度着多智能体、人类科学家与实验机器人。在这个深度融合的实验生态系统中,三者不再孤立作战,而是共同演绎高效、可复现且持续进化的科学发现交响乐章。

这一革命性的实验室人机协作场景,源自英伟达CEO黄仁勋在10月29日华盛顿GTC大会上亲自展示的突破性研究成果。由美国斯坦福大学丛乐教授与普林斯顿大学王梦迪教授团队联合英伟达,正式发布了名为LabOS的智能平台系统,这是全球首个融合人工智能与扩展现实(XR)技术的Co-Scientist(协研科学家)。

LabOS 网站:https://ai4labos.com

论文链接:https://arxiv.org/abs/2510.14861

LabOS的突破性在于,它首次将多模态感知、自我进化智能体与扩展现实(XR)技术有机融合,将干实验的AI计算推理与湿实验的实时人机协同操作无缝连接,构建了一个从假说生成到实验验证的端到端闭环。这不仅为科学研究创建了一个动态演进的“世界模型”,更正式开启了人类与机器智能协同进化的科学发现新纪元。

斯坦福大学丛乐教授表示:“借助与英伟达合作实现的这项突破,我们可以将过去需要数年才能完成的研究工作压缩到数周,将原本耗资数百万美元的项目成本降低至几千美元,将培训顶尖科研人才的时间从几个月缩短到几天。我们非常激动能与NVIDIA紧密合作,展示这项成果。更令人兴奋的是,这仅仅是一个开端,随着自主化科研实验室的兴起,这一创新不仅在改变生活,更将以更快的速度、更低的成本来拯救生命!”

LabOS:AI协研科学家引领人类与机器智能协同进化新纪元 AI协研科学家  LabOS 人机协作 科学发现自动化 第1张

图 1:LabOS 系统架构,融合了干实验的自我进化 AI 智能体与湿实验的 XR + 机器人的人机交互,实现端到端的科学发现

1. 从计算推理到物理操作:AI实验室的具身化演进

以往的科学AI,诸如AlphaFold或Deep Research,大多在纯数字领域中运行。它们是卓越的“理论家”,但无法触及真实的物理实验。实验室的“最后一公里”依然高度依赖科学家的手工操作与隐性经验,这成为科研效率与可复现性的主要瓶颈。

LabOS的突破,正是为AI构建了一个能够融入真实实验室的具身系统。它将抽象智能与物理操作紧密结合,打造出一个具备“脑‑眼‑手”协同能力的AI协研科学家:

会思考的“脑”:自我进化的AI智能体。基于此前的研究STELLA框架,LabOS包含规划、开发、评审与工具创建四大智能体。它们不仅能分解科研任务、编写分析代码,更能通过“工具海洋”模块,从海量文献和数据中自主创建新工具,实现推理能力的持续演进。这种内在的自我进化能力,使其能够通过“推理时扩展”解决新颖的科研挑战。

能理解的“眼”:专为实验室环境定制的视觉语言模型。团队收集了超过200段第一视角的实验视频,构建了LabSuperVision(LSV)基准。他们发现,即便是最先进的通用大模型,在理解精细实验操作上也表现不足。为此,他们训练了专用的LabOS-VLM,使其在错误检测等任务上准确率显著高于通用模型。

可协作的“手”:实时人-机器人一体化的实验执行系统。研究人员佩戴轻量AR眼镜进行实验,LabOS每5-10秒对视频流进行一次分析,实时提供步骤指导、错误告警和操作建议,并协同调度LabOS Robot机器人参与实验操作。所有交互都通过XR界面以手势和语音完成,确保在无菌环境下的流畅人机协作。

LabOS:AI协研科学家引领人类与机器智能协同进化新纪元 AI协研科学家  LabOS 人机协作 科学发现自动化 第2张

图 2:物理实验室场景的 4D 重构,LabOS 通过 XR 眼镜实现人 - 机器人一体化的实时协作

2. 世界模型如何理解实验室环境?

实验室环境的复杂性对AI的视觉理解提出了极高要求。为评估AI模型的实验室感知与推理能力,团队构建了LabSuperVision(LSV)基准——包含200多个由研究人员佩戴摄像头录制第一人称视角的实验视频会话,并由专家标注操作步骤、错误类型及关键参数。结果令人意外,当前领先的AI模型在此基准上表现不佳:Gemini、GPT-4o等在协议对齐与错误识别任务中得分仅2-3分(满分5分),远未达到实验室应用标准。

为解决这一瓶颈,团队通过结合公开实验视频、内部录制数据和专家标注,对专注于实验室场景的视觉语言模型(VLM)进行了后训练。得到的LabOS-VLM能够解码XR眼镜的视觉输入,并将视觉嵌入与语言模型对齐,实现对实验室场景的解读与推理。经监督微调与强化学习优化后,该模型在科学环境中展现出显著提升的视觉推理能力——例如在细胞转染实验中,可实时识别实验员没有按照实验的标准操作程序(SOP)操作而产生的错误,并生成步骤指导。其235B参数版本在错误检测准确率突破90%,远超其他通用模型。

同时,为进一步提升系统对实验室物理空间的理解,LabOS为AI构建了一个具备时间感知与语义理解的三维实验室环境。在这个环境中,AI不仅能识别实验室中的每个器皿、设备与样品,更能理解它们在实验室场景下的语义关系与时间演化,知道实验正在进行哪一步、哪些操作已完成、哪些反应仍在持续、哪一步出了什么问题等等。这套高精度的世界模型,也构成了LabOS Robot机器人在实验室中自主执行各种实验任务的空间认知基础。

这一从数据构建、模型训练到实时交互的完整技术路径,使LabOS系统具备科学视觉推理能力,成功构建了AI、人类与机器人在真实实验场景中的高效协同闭环。

LabOS:AI协研科学家引领人类与机器智能协同进化新纪元 AI协研科学家  LabOS 人机协作 科学发现自动化 第3张

图 3:从 LSV 基准测试数据构建到 LabOS-VLM 模型训练,在实验室场景中实现实时人机交互

3. 人机协作的三大实证案例:从靶点发现到技能传承

LabOS的论文通过三个前沿生物医学研究案例,展示了LabOS作为协作科学家的强大功能:

自主发现癌症免疫治疗新靶点

癌症免疫学的关键挑战在于识别介导肿瘤免疫逃逸的关键基因。传统筛选方法受限于通量且依赖专家经验分析。LabOS在此展现了其“干实验-临床分析-湿实验”全流程研究能力:系统首先通过CRISPR激活筛选技术,在黑色素瘤细胞中自主识别并迭代优化NK细胞杀伤抵抗的候选基因CEACAM6;随后利用癌症基因组图谱(TCGA)数据进行生存分析,建立CEACAM6基因表达与患者预后的临床相关性;最终通过湿实验验证,确认CEACAM6的激活显著增强肿瘤对NK细胞的抵抗能力。这一从计算推理到实验验证的端到端闭环,体现了LabOS在靶点发现中的系统性研究能力。

LabOS:AI协研科学家引领人类与机器智能协同进化新纪元 AI协研科学家  LabOS 人机协作 科学发现自动化 第4张

图 4:LabOS 在靶点发现中的应用机制研究中的科学假说生成与验证

在细胞融合这一基础生物过程的机制研究中,LabOS展现出强大的科学假说生成和验证能力。LabOS通过整合通路富集分析、互作先验与功能性证据,自主将ITSN1提名为核心调控基因。随后,研究团队通过CRISPR干扰技术,在U2OS细胞模型中进行细胞融合的功能性验证。定量成像与细胞实验结果显示,ITSN1的敲低确实显著抑制了细胞融合过程。这一从AI生成的科学假说到湿实验验证的完整闭环,充分体现了LabOS作为协科学家在推动机制发现层面的独特价值。

LabOS:AI协研科学家引领人类与机器智能协同进化新纪元 AI协研科学家  LabOS 人机协作 科学发现自动化 第5张

图 5:LabOS 在机理研究中的应用干细胞工程的技能传承

复杂湿实验的可复现性长期受困于难以言传的隐性知识与操作偏差。LabOS通过XR智能眼镜与视觉推理,在干细胞CRISPR基因编辑等复杂实验中实现实时指导与操作捕捉,并能自动记录专家实验,形成标准化数字流程,最终作为AI导师助力新手快速掌握关键技术,显著提升实验复现性与技能传承效率。

LabOS:AI协研科学家引领人类与机器智能协同进化新纪元 AI协研科学家  LabOS 人机协作 科学发现自动化 第6张

图 6:LabOS 在干细胞研究中的应用

4. 未来展望:迈向自主科学发现的“北极星”目标

LabOS的诞生,标志着科学发现范式的根本性跃迁。丛乐教授和王梦迪教授在阐述其愿景时强调,LabOS旨在“Scale Science with AI Together”——与AI共同拓展科学的边界。

科学探索长期受限于人类认知的速度与实验操作的精度,传统实验室如同孤岛,依赖难以复现的“手艺”与无法规模化的个人经验。LabOS正在打破这一桎梏:它让AI和未来的机器人真正“走进”实验室,理解并参与每一个实验环节,成为与人类科学家并肩工作的协作者。无论成功或失败,每一次实验都成为这位AI Scientist的成长养分,推动其持续进化。这种人类与机器智能协同进化的科研生态系统,将从根本上加速科学发现的进程。

作者团队介绍

丛乐 (Le Cong),斯坦福大学医学院病理学系和遗传学系教授。他被公认为是CRISPR基因编辑领域的奠基人之一。早在哈佛大学攻读博士学位期间,丛乐在导师张锋(Feng Zhang)和乔治・丘奇(George Church)的指导下,作为第一作者在Science, Cell, Nature杂志上发表了数篇标志性论文,首次证实CRISPR/Cas9系统可以在哺乳动物和人类细胞中实现基因编辑,为这一革命性技术的后续应用奠定了基石。之后在Aviv Regev教授指导下,转向单细胞基因组学方向,之后在斯坦福建立独立实验室,发布了一系列将机器学习,AI及生物医学结合的新技术,横跨基因编辑,细胞追踪,免疫靶点发现等多个方向。近年来致力于通过建立“AI科学家”加速生物医学,发布了RNAGenesis基座模型,CRISPR-GPT智能体,和LabOS等一系列工作——将AI智能体,XR眼镜,Robotics自动化结合。

王梦迪 (Mengdi Wang) 教授,普林斯顿大学人工智能创新中心主任、普林斯顿大学电子与计算机工程系教授,此前她14岁考取清华自动化系,18岁进入麻省理工学院 (MIT) 攻读计算机系博士,师从美国国家工程院院士Dimitri P.Bertsekas,博士毕业后一年进入普林斯顿任教并担任博士生导师,成为普林斯顿最年轻终身教授。

本工作由斯坦福大学丛乐教授,普林斯顿大学王梦迪教授领衔,普林斯顿大学张载熙博士、斯坦福大学David Smerkous、斯坦福大学王晓童博士、尹笛博士等为第一作者。