当前位置:首页 > 科技资讯 > 正文

AlphaFold五周年:与大模型融合引领生命科学新革命

AlphaFold迎来发布五周年纪念日之际,该系统的核心开发者、同样凭借AlphaFold斩获诺贝尔化学奖的John Jumper对外公开宣称:

AlphaFold的下一步是与大模型融合。

不过具体实施路径并未详细披露,或许团队已拥有明确思路,甚至相关进程已在推进之中。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第1张

过去五年间,AlphaFold已助力全球超过300万科研人员,精准预测了数以亿计的蛋白质三维结构,并对超过50万篇学术论文产生了深远影响。

可以说,这是继量子力学和分子生物学革命之后,生命科学领域实现的又一次重大飞跃。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第2张

从最初的“结构预测革命”,到随后成为“科研常规工具”,AlphaFold及其衍生技术正迈入全新的大模型集成阶段。

AlphaFold与大模型的结合之路

即便在AI浪潮持续冲击的今天,AlphaFold依然是AI+生命科学领域最具划时代意义的一次成功实践。

作为谷歌DeepMind研发的一款AI科研利器,AlphaFold能够高精度预测蛋白质的三维空间构型。

该系统利用存储于序列和结构数据库中的海量实验数据,通过训练神经网络以识别氨基酸序列间的内在关联与模式。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第3张

2020年首次公开AlphaFold2以来,它迅速成为结构生物化学领域的基石,随后又陆续推出了可预测多蛋白质复合体的AlphaFold Multimer,以及当前速度最快的AlphaFold 3。

如今,AlphaFold已从单一的蛋白质结构预测,扩展至处理更复杂的多分子复合体及更广泛的生物分子交互作用。

科学家们借此取得了诸多突破性成果:

例如,近期密苏里大学的研究团队借助AlphaFold,成功揭示了心血管疾病的关键元凶——坏胆固醇(LDL)的结构奥秘,相关成果发表于《Nature》。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第4张

LDL是动脉粥样硬化、冠心病等心脏疾病的主要风险因子,其核心由ApoB100蛋白构成。但由于该蛋白体积庞大、结构复杂,且与脂质紧密缠绕,长期以来科学家难以解析其原子级三维结构。

研究团队利用AlphaFold先对其氨基酸序列进行结构预测,再将生成模型拟合到实验密度图中,并逐步优化直至与数据对齐。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第5张

最终,他们揭示了ApoB100的笼状结构,为后续心血管疾病治疗策略的研发提供了关键理论支撑。

再比如,利用AlphaFold探究蜜蜂的抗病机制

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第6张

该研究聚焦于蜜蜂体内的关键蛋白Vitellogenin(简称Vg),该蛋白不仅参与群体后代哺育,还与蜜蜂免疫力、抗压能力密切相关。

在AlphaFold的辅助下,研究人员仅用两天便完成了以往需数年才能完成的工作,解密了Vg蛋白的近原子级结构模型,对濒危蜂群保护起到了指导性作用。

此外,AlphaFold在一些非传统应用中也表现突出。

去年与John Jumper同获诺贝尔化学奖的计算生物学家David Baker,正尝试利用AlphaFold预测蛋白质合成设计的成功率。

也有团队将AlphaFold作为搜索引擎,从海量候选蛋白中筛选出最可能与目标蛋白结合的种类。

……

总之,AlphaFold的作用多元且深远,它已超越单一的结构预测工具,成为现代实验设计中不可或缺的一环。

那么,AlphaFold的未来方向何在?

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第7张

据John Jumper透露,下一步将是AlphaFold与更广泛的AI大模型深度融合

AlphaFold将继续推动结构预测作为研究流程的基础环节,同时其预测能力将与大模型强强联合,提升至能够理解科学文献数据、进行科学推理的层次。

这意味着,未来的AlphaFold不仅限于结构预测,还可能提出假设、设计实验流程甚至自动生成研究思路。

对于更复杂的多分子多功能系统,如蛋白质间相互作用、核酸(DNA/RNA)交互等,AlphaFold也能更有效地辅助解析相关生物过程。

这类似于谷歌的另一系统AlphaEvolve,后者使用大模型生成问题解决方案,再用第二个模型校验过滤错误信息。

二者思路相近,但一个面向数学与计算机科学,一个立足生物化学领域。

首位“80后”诺贝尔奖得主

领导开发AlphaFold的核心人物是DeepMind创始人兼CEO哈萨比斯John Jumper

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第8张

其中,John Jumper成为最年轻的诺贝尔化学奖得主,也是首位80后诺奖获得者

他本科就读于范德堡大学,主修数学和物理,随后在剑桥大学获得理论凝聚态物理硕士学位,并在芝加哥大学博士期间转向理论化学研究。

他的博士论文聚焦于如何将机器学习技术应用于蛋白质动力学探索。

2017年,正在从事博士后研究的他得知谷歌DeepMind正从游戏AI开发转向蛋白质结构预测,于是果断申请加入。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第9张

实际上,在AlphaFold之前,谷歌DeepMind曾尝试名为“Foldit”的蛋白质折叠游戏,这源于哈萨比斯自剑桥求学时代对蛋白质折叠问题的关注,他希望通过预测蛋白质结构寻找阿尔茨海默症等疾病的解法。

但游戏在真实分子结构面前显得力不从心,因为蛋白质折叠的训练数据极为有限。

确定一个蛋白质结构往往需耗时数月甚至数年,这一挑战已持续近半个世纪

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第10张

于是团队转向研发AlphaFold

尽管初代AlphaFold在第13届CASP(蛋白质结构预测关键评估赛事)中崭露头角,成功预测43个蛋白质中的25个,击败其余97名参赛者,证明了“机器学习+统计信息”推断蛋白质结构的可行性,

但哈萨比斯坦言,当时的预测质量尚不足以让生物学家实际应用,其针对复杂蛋白的准确性与泛化性存在明显不足。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第11张

意识到仅靠标准机器学习方法难以突破后,DeepMind内部成立攻坚小组,利用Transformer架构重构了AlphaFold 2,并逐步融入生物学专业知识。

但早期AlphaFold 2性能反而不如AlphaFold 1,令团队担忧方向是否正确。为此,他们采取交替策略——

一方面榨取旧系统极限性能,另一方面给予新团队自由试错空间:允许短期性能下降,专注尝试各种新思路。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第12张

直到某天,奇迹悄然降临——系统突然表现卓越。

当天清晨,一位团队成员打开电脑,意外发现AlphaFold 2在某一组蛋白质上的预测精度达到惊人的1.5埃,约等于一个原子宽度。

她的第一反应并非兴奋,而是恐慌,因为结果好到令人怀疑出错。随后几天,团队全力排查错误原因。

最终确认,并无错误——换言之,新系统成功了

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第13张

于是他们投身CASP 14竞赛,并重点攻克了SARS-CoV-2冠状病毒蛋白ORF8。

结果震撼学界:预测准确性均分从原先的60+/100飙升至92.4/100,而此前其他方法仍在40分左右徘徊。

至此,困扰科学界50余年的重大难题——蛋白质折叠问题终获突破性解决。

突破之后,DeepMind更将AlphaFold代码全面开源,并向全球免费发布了2亿个蛋白质的结构预测数据。

AlphaFold的出现标志着生物化学领域正式迈入AI智能时代,也让哈萨比斯和John Jumper荣膺2024年诺贝尔化学奖。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第14张

诺奖组委会对此评价道:

毫不夸张地说,AlphaFold在结构生物化学领域引发了革命,并为设计前所未见的蛋白质开辟了全新的可能性。

但此前,John Jumper接受采访时谦逊表示,自己的获奖概率仅10%,他更期待越来越多科学家利用AlphaFold实现医学与生物学突破。

AlphaFold五周年:与大模型融合引领生命科学新革命 AlphaFold 大模型 蛋白质结构预测 John Jumper 第15张

如今,他对未来规划如下:

作为年轻的诺奖得主,这令我感到些许压力。接下来我将尝试从事一些深入而专注的研究,而对于第二次冲击诺贝尔奖,我认为那是个陷阱。

参考链接:

[1]https://www.technologyreview.com/2025/11/24/1128322/whats-next-for-alphafold-a-conversation-with-a-google-deepmind-nobel-laureate/

[2]https://www.nature.com/articles/d41586-025-03886-9

[3]https://deepmind.google/blog/revealing-a-key-protein-behind-heart-disease

[4]https://deepmind.google/blog/breeding-healthier-and-stronger-honeybees/

[5]https://www.youtube.com/watch?v=d95J8yzvjbQ

[6]https://x.com/GoogleDeepMind/status/1993350293703016451

[7]https://mp.weixin.qq.com/s/NenjAUac6mVKrs0ji6C-og[8]https://fortune.com/2020/11/30/deepmind-solved-protein-folding-alphafold