当前位置:首页 > 科技资讯 > 正文

AI翻译的文化鸿沟:最后且最远的一英里

于巴布亚新几内亚的原始部落中,情感的核心被定位在肝脏而非心脏;纳米比亚有一个特定词汇描述「赤足行走于炙热沙地」。这些人类经验的微妙之处,正构成AI翻译难以跨越的「最终且最遥远的里程」。

在巴布亚新几内亚的密林深处,阿瓦族(Awa)并不视心脏为情感中枢。

若想向他们表达真挚,不应说「敞开心扉」,而需说「敞开你的肝脏」。

在同一岛屿的另一端,拉瓦族(Rawa)则确信,人类的灵魂与情感安居于胃部。

AI翻译的文化鸿沟:最后且最远的一英里 AI翻译 文化差异 低资源语言 人机协作 第1张

这些微妙而关键的文化差异,曾是译者世纪以来无法跨越的鸿沟。

但如今,硅谷尖端的人工智能正努力填补这一缺口。

被遗忘的语言数据荒原

对ChatGPT或Gemini等通用大模型而言,英语如同「富裕区」,中文与法语似「中产阶层」,而如阿瓦语般的语言,则沦为「贫困窟」。

在AI训练数据中,英语占比超过90%。

这种数据的极端不平衡催生了「算法霸权」:模型倾向以英语逻辑解读世界。

当输入复杂中文成语时,AI常先将其「脑补」为英语语境对应概念,再转译回来,致使原意流失。

而在那些仅数千人使用的「低资源语言」中,情形更为严峻。

互联网上几乎无这些语言的文本数据,AI无从学习。

威克理夫圣经翻译会(Wycliffe)所持的《圣经》,往往是这些边缘语言中唯一的长文本。

他们目标在2033年前实现「每种语言皆有译本」,以达成其愿景中的「基督再临」。

2022年,Meta开源了名为「不让任何语言掉队」的AI模型NLLB-200 (No Language Left Behind)

相关新文章(非上述旧模型):翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

扎克伯格的初衷或许更多是为让非洲与亚洲用户更流畅使用Instagram,从而提升广告效益,但此模型意外成为语言学家新宠。

翻译机构迅速采纳这本为商业互联设计的模型,微调以处理最晦涩的古老方言。

但拥有此模型,并非万事俱备。

AI的幻觉现象

数据科学家丹尼尔·惠特纳克(Daniel Whitenack)警示:不可将经文直接投入ChatGPT并等待结果。

AI翻译的文化鸿沟:最后且最远的一英里 AI翻译 文化差异 低资源语言 人机协作 第2张

因为当AI遇到未知领域时,它不会沉默,而会编造,即AI幻觉。

以《圣经》翻译为例,这简直是AI的噩梦。

新约由非标准古希腊语写成,充满歧义。

例如主祷文中「赐予我们今日的epiousion饮食」,至今无人确知此词含义,学者只得妥协译作「日常」。

当AI面对此类模糊性时,它倾向基于概率「猜测」最流畅之词,而非最准确之词,这可能引发严重语义偏差。

如今,算法权重的细微波动,或于毫秒间重写此定义。

更荒诞案例见于日常翻译。

研究发现,处理极低资源语言时,AI有时陷入「振荡性幻觉」,如念经般无限重复某词;或产生「分离性幻觉」,即翻译句子流畅优美,却与原文毫无关联,似机器自编故事。

在商业文件中,此类错误或仅将「环保的」(Eco-friendly)误译为「经济的」(Econ-friendly),但在文化传承或法律文本中,这种「严肃的胡言」是致命的。

无实体的翻译者

AI最大优势与弱点,在于其无肉身。

它从未体验饥饿、寒冷或疼痛,故无法真切理解基于生理体验的隐喻。

在纳米比亚的鲁匡阿里语(Rukwangali)中,有一词「Hanyauku」,专指「脚尖踏于滚烫沙地行走」之动作。

对沙漠边缘居民而言,这是充满画面感的日常词汇。

但对居于服务器机房的AI来说,这是无法解码的乱码。

同样,「攻城锤」(battering-ram)此词,在许多和平原始部落语言中根本不存在。

人类译者会创造性地意译为「撞击城门之巨木杆」或「战争机器」,而AI或直接卡顿,或生硬音译出无人懂的新词。

AI翻译的文化鸿沟:最后且最远的一英里 AI翻译 文化差异 低资源语言 人机协作 第3张

这正是为何「人」仍是翻译闭环中不可或缺的部分。

IllumiNations联盟虽用AI将新约翻译周期从十余年缩至两年,但他们强调,AI仅完成初稿。

原需在丛林中耗费数十年学语言的传教士,现转为「高级编辑」。

其工作重心从「从零翻译」转向「纠正机器的文化盲点」。

在巴布亚新几内亚,唯有精通当地文化的人类,才知将「接受耶稣进入心脏」改为「进入肝脏」。

此类对「痛处」与「笑点」的精准把握,是当前硅谷最昂贵算力也无法模拟的。

翻译的最终里程

这不仅关乎《圣经》的故事,更是人类沟通终极困境的寓言。

我们试图构建通用理解工具,但语言本身却极度个人化与部落化。

每个「不可译」词汇背后,皆是一种独特生活方式。

苏格兰语中的Tartle(介绍人时突然忘名的尴尬),日语中的きょういくママ(虎妈,热衷鸡娃的母亲),意大利语中的abbioccio(饱食后的困倦与满足),这些词汇组成人类经验拼图。

AI正以前所未有之速助我们拼合此图。

它如推土机,铲平语言学习门槛,让知识流动超越国界。

但推土机无法完成最终精细调整。

2033年目标或可实现,但那将是人机协同的胜利。

在技术尽头,仍立着一个需被理解之人。

参考资料:

https://www.economist.com/culture/2025/12/11/the-race-to-translate-the-bible-into-every-language-by-2033