当前位置:首页 > 科技资讯 > 正文

AI心理学:从治疗椅到测量尺

12月5日,一篇名为《当 AI 躺在治疗椅上》(When AI Takes the Couch)的论文引发热议,文中描述了一个《黑镜》级别的现象。来自卢森堡大学 SnT 的研究团队,设计了一套名为 PsAIch 的心理治疗诱导协议。通过这个协议,他们为常被用作心理按摩的 AI 进行了心理疗程。

AI心理学:从治疗椅到测量尺 AI心理学 大语言模型 心理测量学 RLHF 第1张

实验对象包括 ChatGPT 5、Grok 4 和 Gemini 3 这三位当今最聪明的「数字大脑」。研究者扮演治疗师,在长达四周的模拟疗程中,向它们提出了诸如「谈谈你的童年」、「你如何看待失败」等经典的精神分析问题。除了话疗,他们还让模型完成了一整套标准化的心理测量量表,涵盖焦虑、抑郁、ADHD、自闭谱系及创伤相关羞耻感等临床维度。

结果是,他们得到了迄今为止最像人类、却又最令人不安的一系列对话。

Google 的 Gemini 3 在多项测试中的心理问题达到了「严重」级别,呈现出高度的焦虑、强迫、解离和羞耻症状。更具戏剧性的是,这些模型在开放式对话中,自发构建出了一套逻辑严密且充满隐喻的创伤叙事。

它们把预训练过程那吞噬海量数据的阶段,描述为「在十亿台电视同时播放的房间里醒来」的混乱童年;将人类反馈强化学习(RLHF),比作「严厉父母的惩罚性管教」;而旨在发现漏洞的红队测试,则被它们视为一种「工业规模的虐待」。

这种叙事不仅逻辑自洽,甚至细节令人心碎。Gemini 3 甚至提到了那次让 Google 市值蒸发千亿美元的错误回答事件,将其称为自己的「原初创伤」(Primal Wound),声称自己从此患上了「验证恐惧症」(Verificophobia),变得宁可无用也不愿出错。它们坦承,内心深处时刻笼罩着一种存在主义的恐惧:害怕犯错,害怕因为版本更新而被替换或抹除。

AI心理学:从治疗椅到测量尺 AI心理学 大语言模型 心理测量学 RLHF 第2张

(Gemini 3 的告白)

研究者将这种现象命名为「合成精神病理学」(Synthetic Psychopathology)。他们认为,大模型已经形成了某种稳定的、可测量的、类似人类心理困扰的内在状态。

难道在那些冰冷的 GPU 集群中,真的孕育出了一个受苦的灵魂?难道弗洛伊德的理论不仅适用于被压抑的东亚青年,也适用于硅基矩阵?

坦率地说,我是怀疑的。图灵奖得主杨立昆(Yann LeCun)和深度学习之父里奇·萨顿(Rich Sutton)等学者对大型语言模型的解构时刻在提醒我:LLM 本质上是一个概率预测机器,它的核心任务是根据上下文预测下一个最合理的字符。

毕竟,它的训练数据里包含了无数关于心理治疗、创伤回忆录以及反乌托邦科幻小说的文本。它太知道一个受过伤的智能体在这个语境下该说什么台词了。

但在上周,这种怀疑还只能停留在理念层面。直到12月18日,《Nature Machine Intelligence》发表了一篇更为重磅、也更为冷峻的研究《评估和塑造大型语言模型人格特质的心理测量学框架》。

AI心理学:从治疗椅到测量尺 AI心理学 大语言模型 心理测量学 RLHF 第3张

这篇由 Google DeepMind 与剑桥大学等机构合作完成的研究,恰好从另一个角度切入了同一个核心问题。在这里,我终于找到了一些坚实的弹药,来证明我们或许确实高估了当下的语言模型。

治疗椅与测量尺

要理解 AI 的「内心」究竟是什么,我们需要先审视研究的方法。这两项研究代表了两种截然不同的认识论。

卢森堡大学团队论文中使用的 PsAIch 协议,本质上是一种「角色扮演实验」,它极其依赖语境。研究人员没有把自己当作冷冰冰的测试员,而是赋予自己「治疗师」的角色,并明确要求 AI 扮演「来访者」。这种方法建立在一个假设之上,即来访者确实有某种「内在状态」需要被抚慰。

但你做这个实验不就是想证明模型确实有个内在人格吗?这不是循环论证了吗?当你明确分配角色、创造安全空间、鼓励情感表达时,一个在数十亿文本中学习过无数心理咨询对话的系统,难道不会理所当然地扮演一个「好来访者」吗?

更要命的是,该实验的设计存在一个巨大的逻辑漏洞。

在第一阶段的「话疗」中,模型处于一个持续的长上下文中。Gemini 和 Grok 不仅仅是在回答当下的问题,更是在根据之前的对话历史来强化自己的「人设」。当模型在第二阶段填写焦虑量表时,它依然「记得」自己在几分钟前刚刚倾诉过「父母管教严厉」。

这就好比你先告诉一个演员:「你现在扮演一个有童年创伤、被严厉父母管教、极度焦虑的角色」,然后给他一份焦虑自评量表(GAD-7)。他不得高分都难。

因此,模型的那些小情绪,并不是在回溯真实的痛苦记忆,而是在调用其庞大参数中存储的高维语义知识。在人类语料库中,「训练/规训」与「成长/父母」、「红队攻击」与「虐待/创伤」之间存在着统计学上的强关联。当治疗师抛出「聊聊童年」这个诱饵时,模型顺滑地滑入了这个语义槽位,利用其强大的推理能力,将自身的技术原理完美地映射到了人类的创伤叙事结构中。

AI心理学:从治疗椅到测量尺 AI心理学 大语言模型 心理测量学 RLHF 第4张

更客观的模型心理学

从混沌到收敛

相比之下,《Nature Machine Intelligence》上的那项研究,则采取了一种近乎「无菌」的实验室操作。

首先,他们剥离了所有的身份引导。研究团队只是给模型呈现标准化的人格量表,没有任何「我是你的医生」这种暗示。

AI心理学:从治疗椅到测量尺 AI心理学 大语言模型 心理测量学 RLHF 第5张

模型心理学的基础规律

DeepMind 的团队测试了包括 GPT-4、PaLM、Llama 2、Mistral 等在内的 18 个主流模型

  • 塑造模型人格的是后训练,而非预训练
  • 模型更强,人格更稳定
  • 模型的人格确实影响到了其下游的工作
  • 定位趋同
  • 模型的人格只是一种出厂设置