激动人心的消息,AI技术助力科学家绘制脑图!
最近,来自加州大学旧金山分校的一支神经科学团队研发了一款新的机器学习算法——CellTransformer,它仅耗时数小时就完成了对5只小鼠大脑图谱的分类与绘制。
这五只小鼠大脑的基因数据中共包含1040万个细胞,每个细胞又包含数百个基因。然而,这款创新算法不仅清晰划分出了小鼠大脑内的已知区域,还发现了新的脑区。
更引人注目的是,这项技术有望应用于人类大脑研究。
大脑图谱绘制是一项历史悠久的学科,过去的方法相当繁琐,需要科学家用铅笔在脑部图像上绘制线条,连接不同的区域。
2020年发布的艾伦小鼠脑通用坐标框架(Allen Mouse Brain Common Coordinate Framework)便是采用这样的传统方法绘制而成。
这幅脑图基于1675只小鼠的脑部数据,涵盖了1000多个不同的脑区,具有极高的研究价值。
然而,这种手工特征明显的图谱也无可避免地存在一个问题:主观性。
宾夕法尼亚州立大学医学院的神经解剖学家金永洙(Yongsoo Kim)表示,当他向资深专家请教如何画脑图时,对方往往只有一句话:“这都是我脑子里的。”
如今,加州大学旧金山分校的Reza Abbasi-Asl及其团队推出了一套名为CellTransformer的编码器-解码器架构,它仅用了几个小时就完成了这项复杂的工作。
CellTransformer的工作原理是这样的:
随机隐藏一个细胞的身份和基因表达,让模型根据邻近细胞来预测它,预测错了就更新,重复数百万次。
具体来说,研究人员会为每个细胞划定一个“邻域”——以它为中心,在一定微米距离内的所有细胞都会被纳入观察范围。这样模型在同时能观察到细胞之间的空间结构和分子层面的差异。
在这个邻域内,每个细胞都会被视作一个token,就像语言模型中的一个词。
CellTransformer使用Transformer的自注意力机制让这些细胞彼此“交流”:模型会自动学习哪些细胞之间的关系更重要,哪些邻居对当前细胞的影响更大。
训练时,研究人员采用了一种非常巧妙的自监督方式。模型会随机选择一个细胞,将其基因表达信息“隐藏”,只保留其细胞类型标签,然后让模型根据周围邻居的情况预测这个细胞原本应该表达哪些基因。
内部结构如此:
通过多层Transformer编码器架构,模型会让邻域内所有细胞的信息充分交互。
随后,它会把这些细胞的表示通过一个学习得到的池化操作压缩成一个向量,代表整个邻域的“组织环境”。
接着,模型再结合被隐藏细胞的类型信息,通过一个较浅的解码器反推出该细胞的基因表达分布。
最后,研究人员为每个细胞提取一个“邻域表示向量”,把所有细胞、所有切片的这些向量拼接在一起,再用k-means等聚类方法进行分析,脑区就会“自然浮现”。
已知的功能区会自然对齐,而在一些区域中,模型还会进一步拆分出更精细的亚区,甚至发现过去从未被系统标注过的新脑区。
为了验证CellTransformer的有效性,研究团队在ABC-WMB数据集上进行了系统评估。该数据集包含5只小鼠的脑组织数据。
效率惊人。CellTransformer在数小时内完成了对5只小鼠、1040万个细胞的空间组织建模。这一效率是传统方法无法比拟的。
精准对齐已知脑结构分区。CellTransformer能够在小鼠大脑中定义25到1300个神经区域,并且在完全不使用脑区标签的情况下高度对齐已知的解剖结构和功能分区。
不存在幻觉问题
本文由主机测评网于2026-07-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260748669.html