当前位置:首页 > 科技资讯 > 正文

AI语言同质化危机:当‘Delve综合症’侵袭人类表达

午夜两时,我呆望着空白的年终总结文档,困意朦胧中手指无意识敲出:「这并非‘赋能’,而是‘资源闭环’……」

瞬间,空气仿若凝固。我并未开启ChatGPT,但那个标志性的「不是……而是」句式如幽灵般从键盘缝隙悄然溜出。

这并非我个人的怪癖,在座诸位或许都曾遭遇类似情境。马克斯·普朗克人类发展研究所的最新研究揭示了一项令人不寒而栗的趋势:我们曾笃定AI是模仿人类智慧的学徒,但证据表明,这位学徒正悄然转身,开始教导师傅如何言说。

「零号病例:Delve」

为精准捕捉这一现象,研究团队在实验设计上可谓匠心独运——他们调取了超过74万小时的人类语音记录(相当于一个人不眠不休连续收听84年)。数据来源涵盖36万个YouTube演讲视频与77万集播客节目。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第1张

之所以将「播客」列为核心样本,社会语言学家解释:演讲往往经过脚本雕琢,人们有充足时间借助AI润色;而播客则属于高度即兴、高频互动的自发语言。在酣畅的交谈中,人类大脑会切换至近乎「自动驾驶」的直觉模式。倘若AI的特征词汇在此类场景中生根,便意味着它已不再是外置工具,而是深深嵌入「脑髓」。

这套数据筛选策略,果然捕获了异常信号。自2022年末ChatGPT问世以来,人类口语中若干特定词汇的出现频率,勾勒出一条近乎垂直的陡峭曲线。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第2张

在这波语言传染病中,单词「Delve」(钻研)被公认为零号病例。2022年之前,它几乎是字典里的沉睡者,仅在严肃学术论文或正式文学中偶露峥嵘。而进入AI时代,它摇身变为算法最忠诚的宠儿——AI对该词的偏爱程度超出人类数百倍。

紧随其后的还有Meticulous(一丝不苟)、Comprehend(理解)、Underscore(强调)、Realm(领域)这类谦逊有礼、日常对话却罕有问津的词汇。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第3张

佛罗里达州立大学的计算语言学家通过精细比对发现,新词的习得并非「顺其自然」的拓展,而是一场精准、被动的模仿秀。例如,我们疯狂使用Underscore,但其近义词却门可罗雀。

这种选择性的频率井喷暗示:并非我们词汇贫乏而主动求变,而是大脑被AI输出的高频文本持续「投喂」后,形成一种路径依赖。当大脑试图表达「强调」时,那条被AI反复强化的路径,便成为阻力最小的出口。

谁筑起免疫高墙,谁已深陷泥淖?

然而,如何断定这一切归因于AI?或许只是网络漫游过频?社交媒体、短视频、日常互动同样可能重塑语言习惯。

为厘清干扰因素,研究人员引入计量经济学的「合成控制法」。他们借助大数据构建一个「无AI发布」的平行宇宙模型。在那个虚拟世界中,人类语言依循历史逻辑缓慢演变——Delve等词的使用率,平稳如常年不见波澜的A股指数(此处仅为譬喻)。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第4张

而现实宇宙中,这些词汇的爆发与技术发布节点完美吻合,令「AI作为语言习惯改变主因」的推论更具说服力。

这种干预背后隐匿着心理学上的「启动效应」。当我们每日浸淫于AI生成的周报、邮件与新闻简报,这些词汇便在短期记忆中被反复加权。待到我们在麦克风前或会议室中即兴表达,那些被过度激活的词汇便如自动联想般脱口而出。AI的语言风格正以温水煮蛙之势,悄然置换我们个性化的表达基因。

这场语言病毒的传播展现出鲜明的圈层偏好。研究显示,感染率最高的领域集中在科学技术、商业与教育行业。

倒也不……意外。这些从业者恰是最早拥抱AI的先锋,AI在日常工作中的渗透率自然更高。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第5张

他们每日高强度处理算法编织的逻辑框架,早已习惯了那种聪慧、滴水不漏的表达方式。当试图展现专业素养时,潜意识会告诫他们:模仿「AI式正确」是最稳妥的选择。

反观体育与宗教领域,则表现出惊人的免疫力。体育播客中,垃圾话、极端情绪化的叹词与短句仍是主流输出方式。宗教则更为特殊——经文与信仰构筑起一道天然的文化防火墙。

尽管马克斯·普朗克的研究基于英语语境,但中文互联网上的「AI感染」同样俯拾皆是,比如「不是……而是……」这一经典句式。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第6张

平心而论,中文有其特殊性——许多词语原本就常见,并非AI独创,但AI的高频调用极大加速了它们的病毒式扩散。于是中文语境中衍生出怪圈:原本习惯如此表达的人,如今动辄被「随手鉴」打成AI代笔。

上一次类似的感染,当属大厂黑话。其普及程度之广——即便不在大厂、不涉足互联网,也能随口甩出几句「底层逻辑」「赋能」「闭环」「全维度」等「黑话」词汇。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第7张

这种对比揭示了一个残酷真相:越是追求效率、逻辑与标准化的领域,越容易被AI那去个性化的灵魂悄然夺舍。难以被渗透的,要么壁垒坚不可摧(如宗教),要么规则时常被打破、充满野生气息(如体育)。

由此可见,AI侵蚀的远不止词汇表,更是我们对「何为有效表达」的价值判断。这才是整项研究最令人惴惴不安之处——它酷似贪吃蛇游戏,蛇尾愈长,终究会噬咬到自己。

AI语言同质化危机:当‘Delve综合症’侵袭人类表达 AI语言感染  Delve综合症 语言同质化 人类表达独特性 第8张

AI从人类过往积累的纯净数据中汲取养分,提炼出一种最符合概率分布、最平庸的表达风格。随后,人类大规模使用、阅读,下意识习惯这种风格,并在社交媒体与口语中产出更多「含AI量」极高的数据。接着,下一代AI模型又开始抓取这些已被污染、高度同质化的数据进行训练。

这种循环将诱发语言的坍缩。康奈尔大学研究者警告,这会引发集体创造力的稀释。当一种「正确却乏味」的话语弥漫开来,语言中的地域色彩、个人癖好,乃至那些充满生命力的误用都将消失殆尽。语言不再是思维的火花,而沦为流水线上的标准零件。

当然,我们无需过度陷入「被机器扼住咽喉」的恐慌——语言本身便是流动的,我们今天习以为常的许多表达,在几百年前或许尚未诞生。

表达方式的更迭,向来与技术迭代相伴而行。但「Delve综合症」至少为我们敲响一记警钟:世间最无聊的场景,莫过于两人对坐,却像两台机器人般礼貌地交换早已预设好的概率。请守护好你的口癖,你的瑕疵——那是你作为人类不应抹去的生命印记。