在回望人类文明过去百年的重大科学进展时,美国著名传记作家沃尔特·艾萨克森在其著作《解码者》中提出了一个“三层次”理论框架:第一层次是以原子为单位的物理学变革,它让人类掌握了核能,开启了原子时代;第二层次是以0和1为基石的信息技术革命,奠定了数字世界与硅谷创新的基础;而第三层次,则是当前正在重塑未来的生命科学浪潮,特别是基因编辑技术,首次赋予人类“编程生命”的可能性。
基因编辑技术在2020年荣获诺贝尔奖,但其专利之争至今仍在学术界与资本圈引发波澜。若追溯基因编辑技术走向里程碑的关键时刻,许多人都指向2013年发表在《科学》杂志上的一篇论文——《Multiplex Genome Engineering Using CRISPR/Cas Systems》。正是这篇论文将CRISPR-Cas9从实验室概念,推向了在哺乳动物细胞中的实际应用。
若以今日科技类比,那篇论文堪称生命科学的“GPT时刻”,它不仅引领基因编辑进入全新范式,更为后续应用打开了广阔大门。
本期节目中,我们邀请了这篇论文的第一作者、现任斯坦福大学医学院病理系及遗传系助理教授丛乐,他亲历了从“读基因”到“写基因”的科研转折,也见证了CRISPR在短短十余年间从前沿探索演变为改变世界的力量。此次,播客主理人泓君与丛乐一同回顾了基因编辑技术背后的研发历程,探讨它如何为人类未来开启新可能,并展望基因编辑与人工智能结合带来的无限想象空间。
以下是这次对话内容的精选:
泓君 : 这一集我再次尝试拓展能力边界,我们来探讨基因编辑以及AI在该领域的应用。今天的嘉宾是斯坦福大学医学院病理学与遗传学助理教授丛乐。丛乐是2013年发表于《科学》杂志的CRISPR-Cas9论文的第一作者,这篇论文是将基因编辑技术从实验室概念推向哺乳动物细胞应用的里程碑之作。若以当今科技发展比喻,可称其为基因编辑领域的“GPT时刻”,也是生命科学史上最具影响力和划时代意义的研究之一。
这篇论文由您与导师张锋共同完成,能否谈谈当时这篇论文在行业内的地位?为何它对整个基因编辑行业至关重要?
来源:science.org
丛乐:这篇论文与另外几个团队共同首次证明,CRISPR-Cas9基因编辑工具能够编辑人类DNA,在活体人类细胞中进行基因改造。这正是它作为重要科学或技术开发里程碑的关键所在。因为此前CRISPR-Cas9系统仅存在于微生物中,而能在人类细胞中编辑基因组的能力是在2013年才首次得到验证。
泓君:因此,这堪称CRISPR-Cas9在人体和哺乳动物细胞中应用的开山之作,也让基因编辑未来成为一种便捷、易用的技术。
丛乐:是的,核心在于三点。首先,它让所有人认识到我们可以对人类细胞进行DNA改造。其次,它展示了如何通过CRISPR-Cas9这一简单技术进行重新编程。以往改造一个基因可能需耗费巨大成本和时间,但借助合成一段简短的CRISPR-Cas9引导RNA序列,就能编辑任何基因序列,这类似于从步行跃升至马车、火车甚至飞机的状态,使基因编辑在成本下降和规模扩大上实现数量级提升。第三,该方法证明可在活细胞中安全使用。我们在编辑活细胞前后进行测试,发现细胞状态正常,这表明它并非个例或难以落地的技术,而是我们与其他课题组共同证实的安全有效工具。这三点为技术打开更广阔应用提供了关键支撑。
泓君:我们稍后可详细讨论这篇论文与技术,包括2020年诺贝尔奖之争及复杂的专利战争。在此之前,能否简单介绍您的经历?我也好奇,是什么让您在2013年关注到该领域并写出这篇论文。
丛乐: 我成长于中关村,从小热爱电脑游戏,因此高考后进入的第一个专业是电子工程,在清华时我的目标是成为游戏设计师。但学习电子工程一段时间后,一方面因家人健康原因,另一方面我在图书馆阅读到生物医学相关书籍,深受触动,觉得若能设计生命、研发医学药物,将极具价值与意义。而且,我发现该领域仍有许多基本问题未被理解,例如为何有人患糖尿病、遗传病如何传递、衰老过程中阿尔茨海默症的成因等。这些简单问题尚无答案,因此我认为,相较于设计电路产品或软件,设计生命更具挑战性,更能满足好奇心,于是后来转至生物系。
最初,我希望理解如何更好地改造和设计生物问题,因此在哈佛读博时加入了George Church的实验室。在那里,我遇到了当时担任独立研究Fellow的张锋,他相当于独立博士后研究员。George Church是早期接触和提出基因测序与改造技术的科学家之一,我与张锋的结识也深受其影响。
当时张锋与我讨论,我们应该思考如何实现基因编辑,而不仅仅是测序,因为测序只是阅读一本书,而非书写一本书。若想真正理解一个系统,正如理查德·费曼等物理学家所言,只有创造一件事物时,才能真正理解它。我十分赞同张锋的观点,因此当张锋很快获得MIT教职后,我成为他实验室最早的一批学生,参与了最早的CRISPR基因编辑工作。
George Church 图源Isc官网
泓君:您的两位导师都非常杰出。George Church的核心领域在基因测序,当时在“写”的领域已有哪些进展?为何您觉得张锋的想法更具前景?当时在“写”方向是否已有科学前瞻?
丛乐:非常正确。科学常是一个漫长过程,如同多人添砖加瓦构建大厦。就像物理学从薛定谔、波尔到爱因斯坦,最终建立完整的理论物理基础,基因编辑也类似。可从两点分享:首先,最早的基因编辑技术甚至在我加入George Church和张锋实验室前就已存在,例如锌指蛋白(Zinc-finger)。锌指蛋白技术出现较早,因为它是一种能特意识别DNA的蛋白质,可像GPS一样定位基因组序列,尝试进行书写和编辑。
这很有意思,我初识张锋时,在George Church实验室与他合作研究锌指蛋白。为何当时虽有技术却影响力有限?这类似于大哥大时代无法开发强大APP,智能手机才带来移动互联网爆发。锌指蛋白,无论我们自制或从公司购买,一个蛋白需上万美元,仅能编辑一个位置。而博士生年薪约3万美元,因此我一年的工资仅能做一个实验中的小分子,可能数月才能完成一个蛋白,时间和金钱成本极高。最棘手的是,经常设计5到10个蛋白才有一个成功,技术稳定性也不高。
泓君:换言之,最终成功一个蛋白需花费5-10万美元。
丛乐:对,且需数月时间。由于该技术费钱、费时且不够可靠,难以标准化和规模化,因此限制了其巨大影响力。这引向第二点:我们为何转向CRISPR?传统技术有局限性,但基因编辑领域的价值毋庸置疑——若能实现从“读”到“写”再到“设计”基因,将是革命性的。我们看到CRISPR的优势在于,仅需一段简单的引导RNA,合成成本可能仅十元甚至更低,相比之前降低百倍乃至千倍。合成时间从数月缩短至几天,又是十倍到几十倍的提升。
在时间维度上有显著改进,可靠性亦然。虽然最初不易,但我们发现CRISPR编辑几乎每个基因时,成功率接近一半。从过去十次成功一次,到后来五次成功一次,甚至接近二选一,几乎每次都有一定效果。这是几个数量级的提升。正是这些突破让CRISPR真正打开了基因编辑规模化、标准化和广泛应用的大门。
泓君:您当时如何发现CRISPR技术?是因为您一直在此领域,因此能看到不同选项?您如何判断这条路能走通?还是说CRISPR试错成本极低,例如一次实验仅需十元,而锌指蛋白编辑动辄上万美元,几乎可忽略不计?我很好奇您如何注意到这一关键点。
丛乐:第一点,就我们团队而言,最初接触CRISPR始于2009年。当时张锋给我发来一篇论文,他在公开场合也提及此事,包括您刚才提到的艾萨克森所写以Jennifer Doudna为主角的传记中,也描述了她最早接触CRISPR的故事。我真正了解CRISPR,正是从张锋那封邮件开始。
他当时参加了一个报告,一位微生物学家介绍了CRISPR系统。他几乎在听后立即将相关论文转发给我。邮件内容简短,大意是“看看这篇论文,这个系统很有趣”。我读完论文的第一反应是:该系统可能极大降低基因编辑成本和时间,因为它过于简洁。它以一种极其优雅简单的方式,仅需合成几段RNA。依靠沃森-克里克碱基配对原理,A对T、G对C,就能像GPS一样精准定位基因。关键的是,这正是DNA在细胞中复制的天然机制。也就是说,CRISPR仅需一小段RNA就能完成基因改造。当时我意识到,这可能是解决之前所有难题的关键。
后来我与张锋会面,在他的办公室深夜长谈,我认为这是一个值得我用整个博士生涯去尝试的技术。科研中会遇到许多机会,若你足够理解自己想做的事,足够理解领域中的最大痛点和难点,你就会发现有些事物值得投入数年时间。当时我们坚信,这项技术潜力巨大,虽不确定最终能否实现,但它确实可能成为颠覆性突破。
第二点,当时我、张锋及参与项目的同事们都觉得,这个想法太棒了,可能只有我们能想到,有一种谜之自信,当然这是年轻时的想法。但由于该技术价值巨大,能带来数量级改变,确实不止我们能想到。需承认的是,当时有不同团队基于微生物学家的开创性发现,在技术上都想到了这一可能的突破点。
泓君:您在2009年将整个博士生涯押注于此技术时,是否想过如果最终失败会怎样?
丛乐:这个问题很好,我当时非常幸运。在博士第一年到第二年,我在George Church实验室和张锋实验室仅工作几个月,就已发表一篇关于锌指蛋白和另一篇名为TALE效应蛋白的基因编辑早期论文。当时我们用蛋白质基因编辑工具发表了一篇论文,我与张锋是并列第一作者,同时我另有蛋白质精编的小课题,结果也不错。
因此在2010年,即博士第二年,我基本确定能顺利毕业。如同创业时已有第一桶金,我有了兜底之物。确实并非我能承担无限风险,更多是在博士生涯早期幸运地有了两篇可保底的论文,且质量不低。
有此基础,我知道自己可顺利毕业,因此决定将后续三四年投入高风险高回报的研究,这是一个重要原因。第二是性格与时机。我很幸运有张锋支持,我是最早加入他实验室的两三人之一,他刚成为教授,最适合选择高风险研究方向。我作为学生也愿与他一起尝试。当然,我觉得我的性格与张锋契合之处在于我们都受好奇心驱动,当时时机也适合冒险或做这样的事。
泓君:对,且我觉得很厉害的一点是,您的两位导师中,George Church当时已在哈佛大学享有盛名,是基因科学领域的重量级教授。而您提到初遇张锋时,他刚从博士后转助理教授,甚至还在找教职,但您笃定选择与年轻学者合作,认为他的方向更适合您。这需要很大魄力。
丛乐:是的,我也觉得自己幸运。George Church和张锋的最大共同点是,他们都具卓越眼光和判断力。我认为在做原创性、颠覆性研究时,这点至关重要。常无法一开始完全看清事物,但若能先一步意识到方向值得探索,这比执行力本身更关键。
泓君:是的,创业者亦需此素质。您提到2009年开始CRISPR研究时,发现确实不止你们注意到此事。您发现还有谁注意到了?你们是否开始比拼论文发表速度?
丛乐:是的。我记得Jennifer Doudna的传记中写道,2009、2010年我们启动时,最初将其设为几年期的高风险高回报大项目,并不特别急切,因科研本是探索。但后来意识到应更急,速度也很重要。
到2012年,我们已取得很好结果,正打算慢慢打磨、尽可能完美地撰写论文。但在当年6月突然看到Doudna实验室在《科学》发表文章。他们虽仅在体外实验中,但已精确证明可用一段简单引导RNA编程CRISPR系统,实现任意DNA序列编辑。当有人在体外实现后,我们立刻意识到两件事:第一,不止我们想到此方向;第二,既然体外实验已实现,那么在人类细胞中应用只是时间问题,其他团队很快会跟进。因此我们立即加快投稿,不再追求论文“完美”。学术界常有完美主义情结,但关键时刻速度同样重要。
泓君:但您那篇文章最终发表时,仍觉写得漂亮。
丛乐:因我们已酝酿很久,但实际上,更早、更简单的版本或许已足够发表。
泓君:其实您可分阶段发表,不必一口气攒个大的。
丛乐:当然,每人早期文章都漂亮,但我们不仅在第一篇文章中展示破坏和切割基因,还展示了如何精确修复基因。我们甚至进行了多个靶点同时编辑。也就是说,我们早期做了123步,但或许仅1或2步就可先发表。不过没关系,这是生涯早期的学费。
泓君:代价是错过了诺贝尔奖。
丛乐:这很难讲。诺贝尔奖本身带一定主观性。任何奖项都类似。即便我们发表更早,也未必获奖。因我们的工作更多是技术应用化,而从理论和基础实验角度,最初提出并验证核心原理的科学家或许更值得褒奖。诺贝尔奖如何评选,标准是人定的。但我确实觉得,若当时更快些,至少专利争议不会那么大。
张锋教授 图源:mit.edu
泓君:我记得那段时间,除了你们的论文,张锋实验室还在密集发表大量基因编辑相关成果。主要有哪些方向?
丛乐:当拥有底层技术突破,就如同做出智能手机平台iPhone,便可在其上开发无数应用场景。我们实现CRISPR后,从两个维度拓展:纵向深入具体疾病和治疗方法应用;横向拓展不同可能性,例如DNA编辑外,还可做RNA编辑、表观遗传编辑、碱基编辑。横向是拓展不同编辑范式,纵向则涉及肝脏疾病、眼部遗传病、免疫肿瘤大规模基因筛选等靶点发现的基因编辑。因此,一旦拥有核心平台技术,纵向和横向都能展开,当然许多工作也与人合作。
泓君:所以,若有技术底层突破,上面可延展许多应用,关键在于那一步。
丛乐:我感觉与AI类似,对吧?可横向拓展,也可纵向深扎具体应用场景。
泓君:在你们发表论文的同一天,若我没记错,您的另一位导师George Church也发表了一篇基因编辑论文,这是巧合吗?
丛乐:这不是巧合。杂志虽是好的科研传播平台,但时效性常不快。期刊常等待相关领域多篇论文完成投稿和评审,然后集中发表,形成专题系列,因此同一天刊发更多是编辑部安排。另一方面,当时确实有许多研究团队在独立推动技术前沿进展。
泓君:您能讲讲如何注册基因编辑专利吗?我印象中此事闹得挺大。
丛乐:是的,此问题甚至可能最终诉至美国最高法院。我可分享两点关键:第一,美国在2013年前采用“先发明者”制度,即谁先完成发明,谁拥有专利权。而2013年某个时间后,正式进入与全球大部分国家相同的“先申请者”制度,即谁先提交专利申请,谁获得优先权。但因CRISPR技术较早,刚好产生在“先发明者”阶段,因此引发巨大争议。因需证明谁在物理上最先完成发明,而非仅谁先提交申请。
之所以有此变化,是因谁先提交申请易界定,但谁先发明需回溯实验记录、公司邮件、学校邮件,过程复杂。正因如此,CRISPR专利诉讼从地方法院、联邦巡回法院到可能最高法院,还涉及美国专利局和仲裁机构。至今,各方投入资金累计可能超数亿美元。
泓君:但毕竟该技术未来应用价值无限。
丛乐:或至少它看似值这么多钱。第二点,其价值足以支撑高昂诉讼成本。更重要的是,当时确有多个独立研究组在不同时间、地点,甚至不在美国,推进CRISPR基因编辑。这也使专利归属法律争议格外复杂。
泓君 :我们从整体看基因编辑技术,您认为它现在可应用哪些领域?整个应用市场有多大?
丛乐:可从三个维度思考基因编辑。第一维度是对个人而言,涉及自身身体,即治疗疾病。这会引申出更有争议的问题:基因编辑是否可用于预防甚至增强人类能力?但至少在医学领域,它已可针对遗传性或后天性疾病,这是第一个领域——医学。
第二维度是人与环境交互。美国市场上已出现基因编辑土豆制成的薯片,例如在超市可买到乐事薯片,它用基因编辑土豆生产,因编辑后土豆保存期更长、淀粉含量更合理、特性更佳。此外,还有公司出售基因编辑荧光植物,类似应用涵盖农业、环境及工业生产中的合成生物学。甚至有人提出用基因编辑改造蚊子,谷歌某部门曾参与此项目,旨在让蚊子不再传播疟疾等传染病,这对非洲、东南亚热带地区是重要公共健康问题。因此这一维度不仅面向人类个体,还涉及动物、植物和整个生态系统。
第三维度是精神层面,超越物理世界。若未来能对大脑进行基因改造,增强理解和思考能力,它影响的不仅是身体舒适或饮食健康,而是可能更超脱物理范围,虽目前仍带科幻色彩,但也会对未来产生影响。
泓君:精神维度仅是研发进程中的事,有实际应用案例吗?哪怕一两例。
丛乐:目前成熟应用案例不多。但在精神层面,已有相关重要技术,如脑机接口。但我认为真正值得研究的问题是,应思考人类碳基大脑进化速度为何与硅基相差这么大?如今硅基如此强大,人工智能发展迅速,Neuralink等公司推动脑机接口进展很快,已在九人身上实验。但我们对自身大脑进化和改造的研究几乎为零,这是为什么?我个人非常感兴趣研究此事,也认为需从零突破。因脑机接口部分已有许多进展和成果,但在我们自身部分却未多探索。
泓君:因此,若探索基因编辑在精神维度应用,是否需先理解大脑工作原理?例如阿尔茨海默症或抑郁症涉及哪些靶点,智力、记忆力对应哪些靶点?只有掌握这些机制,才能开展基因编辑。
丛乐:我认为有两点。第一,最终需更深入理解大脑运作方式,包括情绪、认知和反应调控机制。第二,虽目前研究仍处早期甚至空白,但任何探索都值得尝试。现我们已可通过脑机接口或其他技术测定部分神经元活性。但若不在基因和细胞层面调控改造神经元,仅观察远远不够。正如不能只读书不写作,何时能写出一本书?至少先从写段子、推文开始。因此我觉得需开始做些简单尝试,哪怕尚未完全理解,但理解也从实践获得。
泓君:这类尝试只能在病人身上进行吗?
丛乐:不一定。我觉得有各种可能。可从动物实验入手,或从更安全角度出发,甚至在实验室通过神经细胞模型模拟研究,我们自己也在做,即不直接在人脑上记录电信号。许多技术研发,包括Neuralink所用电极,并非先直接用于大脑,而是在实验室体外神经细胞上测试,这曾获诺贝尔奖。这里有许多强大技术,先在细胞上测试,再逐步过渡到动物和人体实验,包括Neuralink也从动物、猴子开始。
泓君:按实现程度,基因编辑现可治疗部分疾病,如地中海贫血症。还有其他确认可治疾病吗?
丛乐:今年5月,即两个月前,世界上首个个性化基因疗法治疗了一名不到一岁的婴儿,缩写名KJ。他的肝脏罕见遗传病通过首个个性化CRISPR基因疗法治愈,这是在宾夕法尼亚大学儿童医院完成,也得加州大学和Doudna团队支持,但所用技术来自博德研究所戴维·刘教授。因此,在肝脏疾病中可见很好治疗潜力。
此外,因减肥药出名的礼来公司最近收购了一家利用CRISPR编辑手段治疗心脑血管疾病的公司。虽此类疗法未获临床批准,但在人类试验中已取得初步效果。为何礼来收购?因心脑血管代谢疾病与减肥类似。因此医疗上已见许多有价值潜力应用,但较集中在罕见病上,包括地中海贫血、肝脏罕见病及心脑血管罕见病。
泓君:现在用基因编辑技术治疗疾病,脱靶风险还大吗?是否控制在可控范围内?
丛乐:现不能说全无脱靶或毒性风险,但已有很好方式控制和预测,包括使用计算、机器学习和AI方法优化预测。虽进展不错,但会否像自动驾驶一样有“边角场景”?例如人开到深山老林,自动驾驶失灵,我觉得不能100%避免。我们有了初步进展,但非完全无忧,可能还需更多研究探索。
泓君:除治病外,还有增强型基因编辑,这在社会上讨论较多。例如身高可通过基因编辑增高;眼睛颜色也能通过控制参数改变。那么,未来哪些参数已知可改?哪些尚不知可改或其作用机制?人体哪些基本参数已可用基因编辑改变?
丛乐:这是非常难的问题。有时我们对自身理解反比对外界控制少得多。例如我们接近载人登陆火星,却不能彻底理解解决自身基本问题。有人玩笑说DeepMind的Demis曾预言十年内解决所有人类疾病,可十年后他自己能否不戴眼镜?能否先治好近视?因此我觉得人类常对外界控制强大,但对自身理解和控制不一定那么快,因此我们对一些单基因影响性状,如眼睛颜色、饮酒能力等事,理解较清楚。
泓君:饮酒能力由哪些基因决定?
丛乐:主要由一两个基因决定,很少量基因就能确定。为何有人喝酒脸红?我喝酒脸红,是因体内乙醛脱氢酶活性不足。酒精(乙醇)在体内代谢转化成乙醛,乙醛毒性比乙醇高。若乙醛脱氢酶活性低,乙醛代谢慢,产生毒性,表现为血液代谢不畅、脸红。许多亚洲人此酶活性较低。每人有两个基因拷贝,若一个拷贝有问题,易脸红;若有两个拷贝,可喝很多酒。编辑此基因,可让人更能喝或更不能喝。
泓君:这让我想起许多基因测序公司。做完测序后,他们会告知是否五音不全、能否喝酒。基本上这些基因测序可告知的答案,是否可用基因编辑技术控制?
丛乐:或者说它有很好基础让我们用基因编辑。因我们不仅可做DNA编辑,也可进行RNA编辑,不一定非得是强永久性编辑,至少可通过DNA或RNA编辑手段调节或优化身体状态,甚至做出改变,这都很有可能实现。
但具体实验涉及技术问题。若基因检测发现某特征与免疫系统相关,如是否易过敏,会涉及全身许多细胞,难度可能大于饮酒。饮酒能力主要涉及肝脏代谢细胞,相对更易实现。正如我们刚提到,肝脏在罕见病上已有突破,有些领域因技术更成熟,需改造细胞更特定、更简单,可能更快。
不过目前许多基因测序公司给出的结果并不完全准确,例如他们说我对咖啡不敏感,但我实际敏感。他们现说能测很多东西,如智商,最近许多公司声称能测出,但大多是噱头或测得不准。
泓君:若要改变这些基因,现由专业医疗机构做吗?因我们回顾您写论文时提到,基因编辑成本已大幅下降,市面上甚至可买到用于教学或业余实验的CRISPR套件。是否说若有生物基础知识,在家就可做实验?
丛乐:短期较难。第一,此类套件纯度较低。确实可在宅做小实验,但若在自身进行基因编辑,需材料特别干净安全。正如在街上捡热狗不敢随便吃。第二,基因编辑不仅是设计工具,还需能将CRISPR蛋白或RNA有效递送至目标细胞。正如能做出美食,但无外卖送不到家。递送至正确细胞非常关键。
泓君:递送有多难?
丛乐:这是目前最难环节。因需比对、找到正确位置并避免进入不需位置。例如我们在肝脏研究有进展,但不代表能进入大脑。即使顶级药企实验室也未完全解决此问题,还需持续研发,因此DIY较难。
此外,基因编辑系统优化需多个步骤。如您提到的脱靶效应、目标靶点编辑效率,以及设计是否能在细胞中很好表达。环节复杂,一人难掌握所有细节,传统手段不易突破,但AI可能是突破瓶颈的可能,正如我不懂法律,但通过GPT提问,可能快速入门。
泓君:即使有这些限制,假设未来有人仍想用增强型基因编辑技术改变自身参数。您觉得这在未来社会可能发生吗?
丛乐:我认为很可能。第一原因是我之前看到杂志调查不同年龄段人对基因改造的接受度,结果显示越年轻,如20-30岁、20岁以下、30-40岁者,越接受可想象基因编辑世界,更愿接受对人类自身进行基因改造。从此趋势看,整个社会对此事接受度可能在提高。第二,随技术突破,我们对身高、肥胖、饮酒能力、肌肉状态等影响因素理解更深,编辑手段、递送方式、安全性也在快速提升,加上AI迭代,我觉得未来很可能既是能做也会有人愿做的事。
泓君:现人类科技发展快。一方面是AI,即您说的硅基智能迅速提升;另一方面是人类如何跟上此速度。未来改造人本身是否也会成主流线?此外,该技术获诺贝尔奖后,您觉得基因编辑技术还有哪些重大突破?例如从Cas9到Cas12、Cas13、Cas14,这些核心系统差异是什么?技术还有哪些根本性飞跃?我看到现仍是您写的Cas9论文,应用至今最广。
丛乐:技术层面可从两个方向思考。首先,对DNA的GPS定位和编辑技术最重要突破在哪?Cas9的突破在于,它将原本需费力迭代蛋白质之事,变成简单合成一小段核酸就能搞定,这是底层范式改变。即从其他蛋白到Cas9是一步飞跃,但从Cas9到Cas12、Cas13的进展,更多是小的迭代,英文称渐进式创新,而非底层范式革新和彻底改变。因此这也是为什么Cas9仍是应用最广、最基础的工具。但在特定场景中,这些渐进或更丰富的工具有其应用场景。
第二方向是我确实觉得最终可能出现场景,将基因编辑理解为在第一个范式改变基础上,如何能非常安全有效地在不同场景应用。但这需更多技术开发,例如在大脑改造上,或许不能简单使用现有CRISPR系统。我们最近获资助的项目中,发现人体线粒体中存在一种内源性蛋白-RNA结合系统,可能具备基因编辑潜力。若能调控此机制,或许能在神经系统编辑中发挥巨大作用,可能有巨大价值。
泓君:可延缓衰老吗?
丛乐:这是我们的希望。真正突破可能来自未知领域的新技术。就目前技术范式,Cas9已能做许多事。
泓君:它完全做不到的场景是什么?
丛乐:例如对神经系统进行高效有效的基因改造。虽有人提出可用CRISPR处理衰老,但在大脑中无临床进展。因此我觉得在非常难做到的场景中,可能产生新范式,也需新范式。我们应想到一些CRISPR现完全无法做的场景,在此场景中也许会产生新的关键突破,这样或许在Cas9上产生真正有意义的迭代,而非渐进改良。
泓君:我了解到您与谷歌DeepMind及普林斯顿王梦迪教授做了CRISPR大模型。能否讲讲想法?它主要解决哪些问题?
丛乐:对,这是我们最近刚发表的工作,叫CRISPR GPT,也算借OpenAI热度。此项目是我们与王梦迪教授、DeepMind合作的成果,是一个基因编辑的AI智能体,底层有我们专为基因编辑制定的评测数据集及大模型,是专业领域微调后的大模型。
但更重要一点是,我们不仅有评测集及微调大模型,还在上面构建了一个能完整帮你执行许多基因编辑设计、执行分析的AI智能体。因CRISPR-GPT本身是能帮你更自动完成完整工作流程的AI解决方案。
泓君:它主要解决哪些问题?之前您提到在家做实验的难点有环境、递送、专业知识体系。它在哪些环节能帮忙?
丛乐:主要帮助第三个环节,因这是更偏重知识和专业壁垒的难点。CRISPR GPT集成了过去十一年里基因编辑领域与我们关系好、愿分享数据的科学家,包括张锋本人、Arc Institute的Patrick Hsu、Samantha Konermann等,他们在真实世界积累的基因编辑知识。我们将这些专家知识蒸馏进一个大模型,变成名为CRISPR LLAMA的模型。因当时只有Meta的LLAMA是最好的开源模型,现我们也用其他开源模型。当时我们将专业知识蒸馏后通过微调、强化学习与王梦迪教授和DeepMind做成CRISPR LLAMA基座,在此基座上用专家能力帮助任何使用CRISPR GPT智能体的用户理解如何设计、指导实验中每一步流程,以及拿到结果后如何分析。
可将其理解为基因编辑领域的“Cursor编程助手”。就像程序员用Cursor写代码时,模型能解答问题甚至帮你部署完整产品。使用CRISPR GPT,就像做基因编辑时,边上站了一个张锋,帮你设计实验、设计RNA、蛋白、实验流程,始终有一个基因编辑大牛协助。
泓君:现在大模型领域中,幻觉是非常严重的问题。你们要提供专家型、知识型输出时,如何避免幻觉?
丛乐:特别好问题,我从三点回答。第一,刚才提到我们将许多专业领域知识聚焦成标准级评测集,这东西叫Genome Bench,然后用专家级高质量真实数据训练并强化学习,我们发现这显著降低模型幻觉。例如测试时,我们用评测集中未参与训练的数据评估,原始LLAMA、GPT或Claude会给出多个答案,因它不知你真想做哪个,会告诉你可以去a、b、c三个方案。但我们做完强化学习后,CRISPR LLAMA就非常有主见、坚定,能说这是正确选项。
泓君:这是因为你们在训练中给它的验证标准非常明晰且确定?
丛乐:因我们使用的都是真人知识。第二点,智能体好处在于我们设计类似“内部讨论”机制。我们设计多个智能体,例如一个基于CRISPR LLAMA,另一个可能基于Claude,它们先互相讨论,然后交由一个审核员综合审核。其实现看GPT 5或一些最新智能体文章,他们确实也用此机制进一步降低幻觉,我们也用到此技术。
泓君:我觉得你们思维挺超前,因你们已将模型与智能体结合。
丛乐:是的。我们实验室既做实验,也做AI智能体和模型应用。我们还将CRISPR GPT结果放到真实实验验证,帮我们更好把实验经验回馈设计。也就是说我们不只在电脑上写代码,还把CRISPR GPT产生的结果让真人实验验证。这也帮我们降低幻觉,因我们可以通过实际编辑基因、改造细胞的效果理解智能体缺陷和问题。因此真实世界反馈也是我们能做得更好的方面。当然我们不敢说100%。
泓君:它的准确率大概多少?
丛乐:我们现还不知道,但我们已开放Beta测试,每天有上百人申请账号。我们希望通过用户反馈迭代,告诉我们到底多可靠。我们实验室现也让新来博士生、本科生、甚至中学生直接用CRISPR GPT入门,而非找高年级学生带,说明我们自己对它也很信任,我们自己就是用户。
泓君:此项目性质是什么?开源还是商业化?需付费吗?
丛乐:不用。我们的动力是帮助自身基因编辑研究。我希望每个学生身边都有一个基因编辑“大神”,不用我24/7陪在身边指导。一开始完全从科研角度出发。
泓君:我觉得很有意义,它能帮科学家节省大量时间,也能帮顶尖科学家培养更多人才。我们之前聊到AGI的五个层次:第一层是对话(ChatGPT),第二层是推理,第三层是智能体,再提到第四层时,我们希望大模型是创新者,能提出人未想过的创新方案。您觉得这模型有达到想到人想不到方案的程度吗?还是主要对现有知识压缩蒸馏?
丛乐:我觉得目前大多数智能体还是以压缩、蒸馏以及规模化、自动化为主。例如读一万篇论文,人类需很久,但AI很快完成,类似于您说的第三层能力。当然,我们也希望更多科学家在使用中不断产生反馈,让它的能力不断迭代,进而逐步接近第四层“创新者”。
我当然觉得成立初创公司是把事情规模化最好办法,但同时我们也开源了基础版CRISPR GPT,包括所有评测数据,就是我们希望在科学研究早期,我们不希望只做纯商业东西,我们真的希望公开分享经验,更多依赖开源和社区力量一起做。当然在一些具体场景中,也许我们可以用商业化东西让它变得更可靠、更规模化、更深。但关键要在第三层智能体层面让更多人真正用起来,然后通过不断迭代接近“创新者”。
泓君:我了解现有一些团队,在预训练阶段就引入强化学习,他们希望通过这种方式让AI能产生一些自己想法和创新知识。这可能是大家正在验证但未知结果的机制。可能OpenAI的一些小团队知道验证结果,但尚未公开看到结果的一些新方向。
丛乐:我觉得这方向很有意思。其实除了基因编辑智能体,我们也在做干细胞智能体、衰老智能体及更多模型。
泓君:你们做了几个模型?
丛乐:我们想法是授人以鱼不如授人以渔,我们实际希望建立一些专业场景中的智能体,走通一个更强大的、让大家都能够建立智能体在不同领域中迭代的技术基础设施。因此我们在与不同实验室合作,例如干细胞智能体就是与斯坦福的Matthew Porteous和Joseph Woo两位干细胞领域非常棒的临床医生合作。
泓君:我们现可用CRISPR GPT帮助编辑阿尔茨海默的主要生物标志物,要不要用一个例子讲这模型究竟怎样帮科学家完成此事?
丛乐:可以。例如APOE基因,携带APOE4型变异的人早期罹患阿尔茨海默风险更高,甚至40%以上。但若是APOE2就有保护作用,APOE3相对中性。如果我们既想理解这些变异作用,又希望尝试把APOE4或APOE3改成APOE2,从而降低得阿尔茨海默风险。那么第一步,你只要输入说我现在进行APOE基因编辑,目标是例如把APOE4变成APOE2,你把自然语言输进去,它就会开始先生成一个工作流程。它先会帮你计划此事,生成做此事需先做一二三四五几个步骤,然后它会问你是否感觉这些步骤合理?如果你是新人,可以说我信你,就开始。如果你很专业,你可能说,这块我还想多加一步,或希望尝试三种不同脱靶效应预测手段。也就是说,如果你很懂也可以继续与它交互,深度定制整个计划和工作流程。
确认后,系统会按流程逐步执行,会开始帮你一步一步执行工作流程,但执行过程中它依然会展示进展。例如第一步选择在“工具选择”环节用Cas9还是Cas12、Cas13,系统会基于任务与知识库给出建议,例如我认为Cas9应该是最好的工具,而且你应该使用碱基编辑,因你是把一个APOE4变成一个APOE2,而不是编辑一堆基因,所以它就说你应该用Cas9碱基编辑。如果你觉得对,就可以确认,这都自然语言。如果你觉得有问题说不对,我想用引导编辑,想用一个更强的新的技术,你就可以跟他说,他马上就会根据此内容调整。
而且因我们在创建智能体中有状态记忆能力,所以他会理解如果你已到此步,他就会调整后面相关部分。例如如果你现在是引导编辑,他就会针对引导编辑优化后续脱靶流程,然后这样一步步从选择系统下一步就开始设计引导RNA,帮你设计序列了,这里面他会调用这一步。
因GPT或Claude不懂如何设计RNA蛋白序列,智能体会理解这一步需调用外部模型,甚至可能还需通过我们实验室中专门优化的一个针对神经的模型帮助你设计出来,这是我认为最有可能成功实现编辑的三个,而且它会给你几个选择,并配以可理解图表,告诉你每个方法预测的效率是多少?用什么方法预测脱靶效应的可能性多大?为什么在这个部分基因编辑的位置上比较好?为什么给你这三个建议?优劣势是什么样?然后你可以再设计,而且你也可以说,我觉得这三个都挺好,我准备做三次实验,相当于你可以深度定制需求。
后面例如如果你想做一个脱靶预测,他甚至还可以告诉你,我建议你用这种方案预测,而且你可以点进去看他预测的文章和GitHub上的代码是怎样的,因此每一步你都可以与他交互,也都可以告诉你是怎么回事,同时你也可以定制。大概这样一个流程。
泓君:这真像有位大师在手把手指导。您觉得未来在真人身上编辑阿尔茨海默相关的APOE4是否可能?我们知道APOE4与阿尔茨海默高度相关,但非必然发病,它只是相关性。但很多人知道自己携带该基因后会有疑问:能否把它“清除”?您觉得它什么时候可能进入人体实验?
丛乐:阿尔茨海默涉及神经系统,甚至现越来越多证据表明它是通过免疫调控运作,相当于神经免疫过程,来增强或降低风险。这里有三个点。第一点是背后机理仍不清楚,最好先进一步厘清。举个例子,如果最终我们发现不是神经元主导作用,而是例如小胶质细胞,或一种免疫相关细胞,那才知道其实不应该编辑神经元,而是编辑小胶质细胞这种更与神经免疫相关的细胞类型。
第二点是递送手段与有效性。必须能精准递送到目标细胞。例如APOE有可能在肝脏中,它管脂肪相关功能,其实不一定希望或不一定需要在肝脏进行大规模编辑,技术门槛仍在,尤其是递送上门槛。
第三是CRISPR本身也可以帮助我们理解此机理。若用它理解了APOE4的具体机理及哪个位置,有可能发现通过编辑另一处即可降低风险;最终的治疗手段不一定是基因编辑,也可能是小分子或小核酸药物。因此我觉得真正的解决方案要综合考虑,有可能CRISPR是一个很好的帮助我们理解基因能力的工具,但最终也许通过一个很简单、很安全、很好递送的化学小分子或小核酸方法就能帮助我们解决此问题,不是更好吗?
泓君:因现在基因编辑已能治疗部分疾病,那在做基因编辑疾病治疗的病人里有没有出现一些显著副作用?毕竟一个基因可能兼管多种功能。之前贺建奎编辑婴儿事件也出现过脱靶。我想知道如果有副作用,后果会怎样?
丛乐:因我们并不理解基因组中每一个基因的功能,甚至这里还涉及同一基因不同位点的编辑效果也可能不同,因此就会导致如果不能很好控制和预测脱靶效应的话,它的风险很多时候会有未知状态,但这也是为什么我觉得可以通过更强的AI驱动能力优化此事,更好地预测这些风险,很重要的一个原因。
第二点,工具与适应症要匹配。如果患者已到“死马当活马医”地步,例如晚期肿瘤,使用基因编辑的细胞治疗更有现实意义,因患者愿承担风险。相反,阿尔茨海默属于风险提高但非必然发病,且可能存在延缓或干预手段,在此场景下我觉得就不一定要去推动基因编辑。而且第三点,即便在很重要的场景中需要基因编辑,那也可能用基因编辑手段去理解它的机理,随后采用更安全、脱靶更少的方式,如小核酸,甚至非药物进行治疗,这也是很可能的。
泓君:有可能会创造出未知的新病毒吗?
丛乐:我觉得本质上还是比较难的,因为病毒自己的进化能力也挺强,与其是靠一个人去认真地设计一个,可能它自己进化也能出来一个挺厉害的病毒。
泓君:或者例如被编辑过的婴儿,他体内或许有人类未知的蛋白?
丛乐:这确实是一个很大挑战。为什么我确实觉得对人类进行基因编辑必须极其谨慎,因为影响的不仅是个体,还可能导致遗传,而不是他是一个病重的人需要去救他的命。如果是一个相对健康的年轻人,可能一旦编辑他之后,影响的就不仅是这个人,而是他的后代。那么这种可遗传编辑的东西是非常需要不断的讨论和思考才能够做出的决定,要考虑会不会引入从来没有的东西。但是我们也不应该一棒子打死,绝对不能够这样,因为也许碳基生命需要更好的改造,理解我们自己当然也是进化的方式。人类进化其实就是不断变异、演变的过程,如果有一种可能性是能更好地让我们自己实现某种意义上的进化,那么也许也不要认为此事不应该或不可能发生,但确实应该在一个非常清晰和谨慎的场景中去做这样的尝试。
泓君:您在基因编辑领域刚开始工作时,与此领域的两位传奇人物张锋和George Church都合作过,您觉得从他们身上学到的最重要特质是什么?
丛乐:第一点是做创新的研究,就跟《三体》里说的,要多想、要敢想。就是你需要能够在别人都说应该去北边的时候,敢于说我为什么不去南边看一看,真正地独立思考很多事情,以及敢于在所有人都做a的时候,你思考b的可能性,这是我觉得一个非常重要的能力。这其实是说起来很容易,但真的做起来很难的一个能力。第二个是快速试错的能力。要敢于犯错,但你要确保自己是在快速的犯错,而不是慢慢悠悠地犯错。第三点就是要有保持客观与批判性思维。你需要有一个自己的底线,不能够过于容易地被别人影响。我觉得他俩都是一个很有自己的信念和底线,以及能够自己做判断的一个人,这也是我觉得每个人都需要努力做到的,可能不仅仅是科学,而更广泛的层面上。
泓君:您怎么看George Church做的许多非常激进、大胆、前沿的科学研究?例如复活猛犸象,甚至某些研究在道德和伦理的边界之间徘徊。
丛乐:我见过某些以他为名的项目,起初觉得“不太靠谱”,后来我自己去看了一下发现他确实参与了。George的路径确实更“野”。我觉得有一部分的原因是他可能到了一定的职业生涯的阶段,并不是一个早期、中期的状态。当然他的弟子众多,实验室规模很大,我在时候都有将近100人,可能是整个哈佛医学院最大的实验室了,项目多了也难免会有鱼龙混杂的状态。另一方面, George他也很敢想,他可能是我见过相对来讲最敢想的一个,而且敢想之后也敢做。而且周围愿与他合作的人很多,自然会吸引各色项目。第三点是,就我个人接触而言,George是一个总体上很愿意支持别人的一个人。
泓君:看得出来,我其实也遇到了很多他的学生,在做一些商业上的事情时都得到了George的支持。
丛乐:有些人是倾向于说NO,George可能是倾向于说YES的性格。因此我觉得这三点可能让他会有一些争议。
泓君:因张锋跟George不仅仅是学术上成功,他们在商业上也很成功。做学术跟做商业可能底层逻辑相通,但还是有一些方法上的不同,您觉得他们思维方式的厉害之处是什么?
丛乐:从一个观察角度来看的话,他们俩成功之处在于,第一,他们确实很会找跟自己互补而专业的人去做一些事情。像张锋当时在做制药的时候,他公司的CEO往往并不是由张锋自己来,因为制药行业是需要积累的,跟AI行业还是不一样的,而且更多的是强监管、漫长周期的事情,所以他就会找之前曾经有过创业成功经历、更加理解制药过程的人来做他公司的CEO。George Church也经常是这样的。然后第二点,他们也非常理解做规模化的事情是需要有资本和商业上的加持才会做得更好、更快,因为毕竟你需要有一个飞轮转起来的过程,所以他们也都非常注意去跟资本去进行合作和对接,就是不能天天只在自己实验室里面闭门造车,要做到在商业上成功,还是要走出去。
泓君:了解,特别好,我今天学到了很多,您最后还有什么要补充的吗?
丛乐:最后一点补充,就是我觉得现在是一个充满着机会和挑战的时代,有很多好消息、坏消息,有很多危与机并存的时代。我们短期内未必迅速达到Level 5之类的更高层级的智能,但我们需要让AI更好地与真实世界交互对接,同时也要认真思考人类作为碳基生命应该如何改变与进化。对这两件事,我们思考还不够多。
泓君:其实您刚刚谈到George时,我也在想,在关于人类自身进化的底层思维、哲学与价值观层面,也许他可能想清楚了。例如您提到硅基智能在快速进化,而人类作为碳基生物身体仍然还是两千年前,我们也需要进化。但到底如何进化?采用更激进还是更温和的手段?我觉得这可能涉及到很多底层的基础知识,同时又有哲学思辨的讨论。
丛乐:是的,还需要有人去做尝试。这也是为什么我自己就在努力往这个方向去做的原因。因为想法总是会有很多,真正做出来才能产生最大的价值。例如我在通过跟王梦迪教授和很多机器学习的顶尖科学家合作中理解了更多的AI,我也通过在张锋和George Church的指导研究中学到了更多关于生命的思考以及研究的方法。因此我非常希望有更多的资源和人能够一起进入到这个方向上,我自己也会全力地往这个方向努力。
【相关延伸阅读】
1.丛乐(Le Cong)2013年CRISPR-Cas9论文:
《Multiplex Genome Engineering Using CRISPR/Cas Systems》
2.CRISPR-GPT论文:
《CRISPR-GPT for agentic automation of gene-editing experiments》
3.沃尔特·艾萨克森撰写的基因编辑开创者珍妮弗·杜德纳传记:《解码者:珍妮弗·杜德纳、基因编辑的历史与未来》
本文由主机测评网于2025-12-29发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20251213782.html