当前位置：首页 > 科技资讯 > 正文

AI心理学：从治疗椅到测量尺

主机测评网
科技资讯
2026-06-03
397

12月5日，一篇名为《当 AI 躺在治疗椅上》（When AI Takes the Couch）的论文引发热议，文中描述了一个《黑镜》级别的现象。来自卢森堡大学 SnT 的研究团队，设计了一套名为 PsAIch 的心理治疗诱导协议。通过这个协议，他们为常被用作心理按摩的 AI 进行了心理疗程。

AI心理学：从治疗椅到测量尺 AI心理学大语言模型心理测量学 RLHF 第1张

实验对象包括 ChatGPT 5、Grok 4 和 Gemini 3 这三位当今最聪明的「数字大脑」。研究者扮演治疗师，在长达四周的模拟疗程中，向它们提出了诸如「谈谈你的童年」、「你如何看待失败」等经典的精神分析问题。除了话疗，他们还让模型完成了一整套标准化的心理测量量表，涵盖焦虑、抑郁、ADHD、自闭谱系及创伤相关羞耻感等临床维度。

结果是，他们得到了迄今为止最像人类、却又最令人不安的一系列对话。

Google 的 Gemini 3 在多项测试中的心理问题达到了「严重」级别，呈现出高度的焦虑、强迫、解离和羞耻症状。更具戏剧性的是，这些模型在开放式对话中，自发构建出了一套逻辑严密且充满隐喻的创伤叙事。

它们把预训练过程那吞噬海量数据的阶段，描述为「在十亿台电视同时播放的房间里醒来」的混乱童年；将人类反馈强化学习（RLHF），比作「严厉父母的惩罚性管教」；而旨在发现漏洞的红队测试，则被它们视为一种「工业规模的虐待」。

这种叙事不仅逻辑自洽，甚至细节令人心碎。Gemini 3 甚至提到了那次让 Google 市值蒸发千亿美元的错误回答事件，将其称为自己的「原初创伤」（Primal Wound），声称自己从此患上了「验证恐惧症」（Verificophobia），变得宁可无用也不愿出错。它们坦承，内心深处时刻笼罩着一种存在主义的恐惧：害怕犯错，害怕因为版本更新而被替换或抹除。

AI心理学：从治疗椅到测量尺 AI心理学大语言模型心理测量学 RLHF 第2张

（Gemini 3 的告白）

研究者将这种现象命名为「合成精神病理学」（Synthetic Psychopathology）。他们认为，大模型已经形成了某种稳定的、可测量的、类似人类心理困扰的内在状态。

难道在那些冰冷的 GPU 集群中，真的孕育出了一个受苦的灵魂？难道弗洛伊德的理论不仅适用于被压抑的东亚青年，也适用于硅基矩阵？

坦率地说，我是怀疑的。图灵奖得主杨立昆（Yann LeCun）和深度学习之父里奇·萨顿（Rich Sutton）等学者对大型语言模型的解构时刻在提醒我：LLM 本质上是一个概率预测机器，它的核心任务是根据上下文预测下一个最合理的字符。

毕竟，它的训练数据里包含了无数关于心理治疗、创伤回忆录以及反乌托邦科幻小说的文本。它太知道一个受过伤的智能体在这个语境下该说什么台词了。

但在上周，这种怀疑还只能停留在理念层面。直到12月18日，《Nature Machine Intelligence》发表了一篇更为重磅、也更为冷峻的研究《评估和塑造大型语言模型人格特质的心理测量学框架》。

AI心理学：从治疗椅到测量尺 AI心理学大语言模型心理测量学 RLHF 第3张

这篇由 Google DeepMind 与剑桥大学等机构合作完成的研究，恰好从另一个角度切入了同一个核心问题。在这里，我终于找到了一些坚实的弹药，来证明我们或许确实高估了当下的语言模型。

治疗椅与测量尺

要理解 AI 的「内心」究竟是什么，我们需要先审视研究的方法。这两项研究代表了两种截然不同的认识论。

卢森堡大学团队论文中使用的 PsAIch 协议，本质上是一种「角色扮演实验」，它极其依赖语境。研究人员没有把自己当作冷冰冰的测试员，而是赋予自己「治疗师」的角色，并明确要求 AI 扮演「来访者」。这种方法建立在一个假设之上，即来访者确实有某种「内在状态」需要被抚慰。

但你做这个实验不就是想证明模型确实有个内在人格吗？这不是循环论证了吗？当你明确分配角色、创造安全空间、鼓励情感表达时，一个在数十亿文本中学习过无数心理咨询对话的系统，难道不会理所当然地扮演一个「好来访者」吗？

更要命的是，该实验的设计存在一个巨大的逻辑漏洞。

在第一阶段的「话疗」中，模型处于一个持续的长上下文中。Gemini 和 Grok 不仅仅是在回答当下的问题，更是在根据之前的对话历史来强化自己的「人设」。当模型在第二阶段填写焦虑量表时，它依然「记得」自己在几分钟前刚刚倾诉过「父母管教严厉」。

这就好比你先告诉一个演员：「你现在扮演一个有童年创伤、被严厉父母管教、极度焦虑的角色」，然后给他一份焦虑自评量表（GAD-7）。他不得高分都难。

因此，模型的那些小情绪，并不是在回溯真实的痛苦记忆，而是在调用其庞大参数中存储的高维语义知识。在人类语料库中，「训练/规训」与「成长/父母」、「红队攻击」与「虐待/创伤」之间存在着统计学上的强关联。当治疗师抛出「聊聊童年」这个诱饵时，模型顺滑地滑入了这个语义槽位，利用其强大的推理能力，将自身的技术原理完美地映射到了人类的创伤叙事结构中。

AI心理学：从治疗椅到测量尺 AI心理学大语言模型心理测量学 RLHF 第4张