ChatGPT文风为何充满“AI味”?原因终于浮出水面!
肯尼亚作家发声:这都是因为我们!
近日,一位肯尼亚作家在Hacker News上发表的一篇“控诉帖”引发了广泛关注——
这位作家直言:“我是肯尼亚人,并非我的文风与ChatGPT相似,而是ChatGPT的文风与我如出一辙。”
点开帖子才知,这位名叫Marcus Olang’的作家(以下简称小马)连续多篇精心撰写的文章均遭退稿,理由竟都是“太像ChatGPT生成”。
想到自己从小接受的教育——文章需如完美大厦、须展现丰富词汇——如今却被误认为AI生成,小马不禁怒吼:
对于那些热衷于侦查数字虚假性的侦探们,我想说:朋友,欢迎来到肯尼亚教室、会议室或公司内部Teams聊天室里一个典型的星期二。你们所谓的机器指纹,实际上却是我们教育的化石记录。
早有消息指出,为节约成本,许多AI公司将RLHF等任务外包给非洲人员,因此模型用语习惯难免偏向非洲。
我们有理由怀疑:ChatGPT是否从肯尼亚“偷师”写作技巧?
让我们一探究竟——
事情是这样的。
来自肯尼亚的Marcus Olang’(小马)近日发文控诉,自年初收到第一条回复起,他便陷入“自证非AI”的困境。当时甲方反馈:
你写得不错,逻辑也扎实,就是……能否用更“人性化”的方式重写?现在读起来太像ChatGPT了。
不仅是他,身边多位作家朋友也遭遇类似反馈。
在仔细对比自己与ChatGPT的文本后,小马无奈承认——别说,咱们的文风确实与ChatGPT相似。
从某种意义上说,指控者并非完全错误。我的写作风格确实与大语言模型的输出有几分相似。
我们都倾向于使用结构严谨、平衡的句子。我们都喜欢使用过渡词确保逻辑流畅。我们都会偶尔使用(如今看来几乎成了罪证)连字符、分号或破折号来连接相关想法,使其比简单的句号更显优雅。
不过小马认为:
讽刺之处在于,这种讽刺或许会让我们的祖先会心一笑。
他表示,不是自己写得像ChatGPT,而是ChatGPT无意中模仿了他们——模仿他们这一代,以及过去几代在全球南方,尤其是肯尼亚这类地方,经过严苛教育体系“锻造”出来的人。
从小到大,小马接受的写作指导都讲求规范、精心遣词造句(是谁DNA又动了?)。
我们从小被教导,文章必须像一座完美的大厦。引言是地基,主体是承重墙,结论是封顶,必须坚固、对称、无懈可击。我们要用“首先、其次、最后”构建逻辑,用“此外、然而、因此”精确转折,用“光辉灿烂”、“精疲力竭”这样的“好词”展现词汇量。
这种写作,是我们的敲门砖,是我们在KCPE(小学毕业考试)决定命运的四十分钟里必须掌握的生存技能,是我们向上攀爬的阶梯。它严谨、清晰、富有说服力,但也因此,在今天某些人耳中,它听起来“缺乏人性的温度”。
而这一套恰巧也被AI学去了。
讽刺的是,AI大模型(如ChatGPT)正是从海量书籍、论文、报告中学习写作的。这些文本库中充满了历史沉淀的经典、正式书面语——也就是我们被训练去模仿的文体。因此,当AI为显得“权威”和“可信”而输出时,其文风自然与我所受的教育产生诡异的“孪生”效应。
于是,面对“文风像AI”的指责,小马愤而吐槽:
这台机器为了显得权威,最终听起来却像个英语作文得了“A”的肯尼亚小学毕业考试(KCPE)毕业生。它无意中复制了大英帝国的语言幽灵。
他还提到,现有AI检测器往往更倾向于将流畅、逻辑严密、句式规整的文本标记为AI生成,而这正是许多非英语母语者(尤其接受过严格正式写作训练的人)的写作特点,因此他们更容易被误判。
总之,小马用自己的经历告诉大家——
由于历史原因,一些非英语母语者的写作本就是现有AI模型的“教材”,而他们现在却成了AI普及后的“受害者”。
这一说法获得众多网友认同:
然而,令人啼笑皆非的是,小马这篇感情饱满、“活人感”十足的文章,竟被Pangram网站判定为100% AI生成。
啊这……小马不语,只是一味生气吐血(doge)。
基于类似原因,人们发现ChatGPT对“delve”(挖掘、深入研究)一词情有独钟。
《卫报》曾刊文指出,墨尔本斯威本科技大学AI专家Jeremy Nguyen发现——
在PubMed这类专业学术网站上,“delve”的出现频率近年激增10到100倍。
(PubMed收录80余国5200+生物医学期刊,总量超3900万条文献。)
这暗示大量研究人员可能用ChatGPT辅助写作,并将其偏好词汇带入学术文本。
这一现象还引发马斯克和YC联合创始人保罗·格雷厄姆关注,后者发帖:
有人给我发了一封带“delve”的邮件,这个词表明文本大概率是AI生成的(暗示对方用AI写项目书还找他投资hhh)。
格雷厄姆发帖后,ChatGPT官号还用该词公开整活,引来无数网友跟风。
进一步数据分析显示,“delve”并非孤例——
像“explore”、“tapestry”、“testament”和“leverage”等词汇,在ChatGPT生成文本中出现频率也异常高。
《卫报》详细揭开了谜底——
为将大语言模型“驯化”成安全、有用、可控的聊天机器人,企业通常雇佣大量人类测试员,让他们与模型互动并提供反馈(如点赞/点踩,或撰写理想回复)。
模型从海量人类偏好数据中学习,调整自身行为,即RLHF(基于人类反馈的强化学习)。
出于人力成本考量,RLHF这项劳动密集型工作被大量外包给肯尼亚、尼日利亚等英语区非洲国家。
对这些国家,“delve”这类词正是他们日常生活中自然、规范的商务或学术英语,因此被高频使用。
于是这些词自然在ChatGPT中高频出现。
BTW,你还有哪些鉴别AI内容的小技巧?
有网友先打了个样:
“幼兽般的呜咽”、“瞳孔缩成针尖”……嗯,一般人确实想不到(doge)。
参考链接:
[1]https://marcusolang.substack.com/p/im-kenyan-i-dont-write-like-chatgpt
[2]https://news.ycombinator.com/item?id=46273466
[3]https://x.com/JeremyNguyenPhD/status/1780580567215681644
[4]https://x.com/ChatGPTapp/status/1780721920322781447
本文由主机测评网于2026-03-09发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260329589.html