当前位置:首页 > 科技资讯 > 正文

MIT科学家发现大脑中内置“生物版ChatGPT”:语言网络独立于思考

MIT神经科学家Ev Fedorenko通过扫描约1400人的大脑,识别出一个类似「生物版ChatGPT」的语言处理系统,它不负责思考或情绪,只专注于将词语与意义映射、拼成句子。这一发现揭示了语言与思维的分离,让我们重新审视大脑中隐藏的奥秘。

你是否想过,你的大脑里可能内置了一个“生物版ChatGPT”?

这并非比喻,而是实实在在的科学研究:人类大脑中确实存在一套专门处理语言的神经系统,它不负责思考,也不处理情绪,只专注一件事——将词语与意义对应起来,再把它们组合成句子。

这个系统被神经科学家Ev Fedorenko命名为“语言网络”(language network)。

大脑天生的LLM系统

很多人可能觉得语言和思考是同一过程,找词的过程本身就是思考的一部分。但语言和思维真的是一回事吗?语言究竟是思维的核心,还是一个完全独立的系统?对此,Fedorenko提出了一个反直觉的观点:语言不等于思考,它更像是思考的“接口”或“外包装”。

对许多人来说,找到合适的词确实是思考的重要组成部分,但这并不意味语言就是思考本身。Fedorenko将独立于思考之外的专门系统称为“语言网络”,它负责映射词语与其意义之间的对应关系。

她将这个系统想象成一个增强版的解析器:“它就像一张地图,告诉你大脑里哪一块区域储存着哪一类意义,好比一个加强版的解析器,帮我们把语言拼装起来。”至于真正的思考和有趣的内容,则发生在这个语言网络之外。

有趣的是,早在ChatGPT出现之前,Fedorenko就在过去15年里不断收集人类大脑中语言网络的证据,并发现它和大语言模型(LLM)之间有不少相似之处。从某种意义上说,我们确实随身携带着一个“生物版ChatGPT”——一个不具备心智的语言处理器。

Fedorenko的研究或许能带来一丝安慰:即使一台机器能生成流畅的文字,它仍然不会思考。在麻省理工学院的实验室里,Fedorenko花了15年时间积累关于语言网络的生物学证据。

与AI模型不同,人类的语言网络不会随意拼凑句子。它更像是连接外部输入(听到的、看到的、甚至手语)与大脑其他区域意义表征(如情景记忆、社会认知,而这些LLM并不具备)之间的翻译器。而且人类的语言网络并不大,如果把相关组织聚集在一起,只有一颗草莓大小。尽管体积小,一旦受损影响却十分巨大。例如,语言网络受损会导致各种失语症,此时人的复杂思维依然存在,却无法表达出来;有时甚至连别人说的词都难以区分。

MIT科学家发现大脑中内置“生物版ChatGPT”:语言网络独立于思考 语言网络  ChatGPT 神经科学 思维与语言分离 第1张

Fedorenko在MIT与博士后研究员Andrea de Varda (左) and Halie Olson (右)

扫描1400人大脑,她发现了人脑中的「语言网络」

Fedorenko上世纪80年代在苏联长大,自幼对语言产生了浓厚兴趣。在母亲的要求下,她学会了俄语、英语、法语、德语、西班牙语和波兰语六种语言。成绩优异的她最终获得了哈佛大学全额奖学金。在哈佛主修语言学期间,她逐渐感受到语言学的局限性:“这些语言学课很有趣,但更像是在解谜,而不是解释现实世界到底是怎么运作的。”于是她又学习了心理学。

2002年,她从哈佛大学毕业,获得心理学与语言学学士学位。随后进入麻省理工学院(MIT)攻读认知科学与神经科学研究生课程,并于2007年获得博士学位。在此期间,她开始与Nancy Kanwisher合作,后者首次发现了梭状回脸区——一个专门识别人脸的区域。Fedorenko希望找到语言在大脑中的对应区域,但当时这方面的研究基础相当薄弱。

通过对大约1400名受试者的大脑扫描,Fedorenko识别出一个普遍存在的语言网络,并将其定义为“始终负责语言计算的组织”。随着研究成果积累,2024年她在《Nature Reviews Neuroscience》上发表综述,将人类语言网络定义为一种“自然类别”——一个天然、独立成型、专门处理语言的功能单元,存在于“每一个典型的成年人脑中”。

MIT科学家发现大脑中内置“生物版ChatGPT”:语言网络独立于思考 语言网络  ChatGPT 神经科学 思维与语言分离 第2张

Fedorenko办公室里的三个大脑模型突出了语言网络。从上到下:紫色的是Laura Bundesen的刺绣作品;红色的是Hannah Small的十字绣;红色的是3D打印模型。

什么是语言网络?

在成年人大脑中,有一组核心区域作为一个互相连结的系统,负责计算语言结构。它们存储词语与意义之间的映射关系,以及如何把词组合成句子的规则。我们在学习一门语言时,学的就是这些东西。掌握了这套“代码”,我们就能灵活地将念头转换成词序。

Fedorenko表示,语言网络和人类身体的其他器官一样,是一个自然类别,拥有一个能指出具体位置的物理结构。例如,梭状回脸区就是一个可以明确界定的功能单元。而在语言网络里,大多数人的额叶皮层都有三个区域,都位于左额叶的侧面。另外,还有几个区域沿着中颞回的侧面分布,那是一大片厚厚的组织沿着整个颞叶延伸。这些构成了语言网络的核心部分。通过fMRI扫描可以发现,这些区域在处理语言时总是一起激活。

Fedorenko称,到目前为止扫描了大约1400人,已经能建立一张概率地图,显示这些区域最可能出现的位置。虽然个体之间略有差异,但整体模式非常一致。在这些额叶和颞叶的大区域里,每个人都会有一些组织在可靠地执行语言计算。

语言网络与其它已知与语言相关的脑解剖区域(如布罗卡区)不同。Fedorenko认为布罗卡区更多是一个发音动作的规划区域,它根据语音的声音表征,计算出说出这些声音所需的动作,指挥嘴部肌肉的活动,属于语言网络下游,接收语言网络传过去的结构化语言信息。语言网络既不负责发声,也不负责思考,它在本质上是低层级的感知与运动系统与高层级的抽象意义和推理系统之间的接口。

Fedorenko提到人类主要用语言做两件事。第一是表达:脑子里蹦出一个模糊的念头,再从词汇库里挑出一套词序,把这个念头表达出来。语言网络把这个词序交给运动系统,让你说出来、写出来或打手语。第二是理解:声音进耳朵或光线进眼睛后,感知系统先把输入处理成词序,然后语言网络解析它,在词序里找熟悉的块,再把它们指向存储在别处的意义表征。对于表达和理解,这个系统都是一个不断更新的“形式到意义的映射仓库”。掌握了这套代码后,我们既能把想法说出来,也能理解别人说的话。

语言网络的功能是为了交流,那么语言网络的专门化究竟细到什么程度?是否存在专门对某些话语反应的细胞?Fedorenko认为语言依赖上下文,因此推测语言网络系统内的编码方式会有些分布式,可能存在对语言某些特定方面反应特别强的神经元。比如,语言网络区域的一些细胞对书面语和听觉语言也会有类似反应。

谈到语言网络的模式或特征,Fedorenko认为大脑的一般物体识别机制和语言网络的抽象程度非常接近。这和下颞皮层里储存物体形状片段、梭状回脸区储存“一张脸的模板”是类似的。我们利用这些表征来识别现实世界中的物体,但它们本身与我们的世界知识并无直接联系。

以一句无意义句子“无色的绿色想法愤怒地沉睡”为例,我们可以大致听懂它的结构,却完全无法把它对应到任何现实知识上。Fedorenko和其他团队的研究证实,语言网络对这种无意义句子的反应强度,和对那些有意义的句子几乎一样。这并不意味着语言网络“笨”,而是说明它确实是个比较浅层的系统。

Fedorenko认同“每个人脑子里都有个LLM”这样的说法。她认为语言网络在很多方面都很像早期的大模型:学习语言的规律,以及词和词之间的关系。在现实中,你可能会遇到一个说话特别流畅的人,但听了一会儿会发现他们根本没讲什么内容,而他们的大脑也没任何损伤。这说明他们只调动了大脑中语言网络部分的功能,而思考部分完全没有用上。

虽然人类语言来自一个类似ChatGPT那样“无意识”的系统,这听起来有点反直觉,但Fedorenko在研究早期也认为语言是高级思维的核心,后来她的研究并不支持这一假设。早在2011年,她已经清楚认识到,语言网络的所有部分都高度专门化用于语言。“对于科学家来说,只能更新认知,继续向前探索。”

参考资料:

https://www.quantamagazine.org/the-polyglot-neuroscientist-resolving-how-the-brain-parses-language-20251205/