当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.1惊现“极你太美”事件,网友纷纷探讨根源

DeepSeek V3.1惊现“极你太美”事件,网友纷纷探讨根源 V3.1 bug token 第1张

昨天,有网友在社交媒体发帖称,在开发 UI 时检查腾讯 Codebuddy 改写的内容,发现有一串广告写进去了:往函数里面赋值了一个极速电竞 APP。“忍不了了,直接卸载”该网友说道。

DeepSeek V3.1惊现“极你太美”事件,网友纷纷探讨根源 V3.1 bug token 第2张

此外,还有网友在字节 Trae 国内版也发现了 bug,生成结果会随机出现“极”字,如果让模型自动修改,则会直接把上下的代码删除。

DeepSeek V3.1惊现“极你太美”事件,网友纷纷探讨根源 V3.1 bug token 第3张

随后,发现 Codebuddy 问题的网友在评论区表示,“是 DeepSeek 模型引入的 bug,腾讯已经把问题上报了,后续会修复。”

无论是 Codebuddy 还是 Trae,出现问题的根源都指向了 DeepSeek 最新的 V3.1。

实际上,一天前,开发者 notdba 就在 Reddit 上表示,其用 DeepSeek V3.1 做了一些测试,发现该模型会在完全意想不到的地方生成以下 token:

  • “extreme”(id:15075)
  • “极”(id:2577)
  • “極”(id:16411)

“一开始我以为是因为我用了极端的 IQ1_S 量化,或者是 imatrix 校准数据集里的某些边缘情况导致的。但后来我用 Fireworks 提供的 FP8 全精度模型测试时,也出现了同样的问题。”notdba 表示,这些极端 token 还会不断地在其他出乎意料的地方以第二或第三选择的形式出现。

DeepSeek V3.1惊现“极你太美”事件,网友纷纷探讨根源 V3.1 bug token 第4张

DeepSeek V3.1惊现“极你太美”事件,网友纷纷探讨根源 V3.1 bug token 第5张

示例 3:(Fireworks,参数 top_k=1,temperature=1)

预期输出:V1

实际输出:V 极

有网友则表示,“我使用 DeepSeek 的官方 API 完成了两个 Claude Code 项目,没有遇到这个问题。有趣的是,使用 DeepInfra 或 Akash Chat 的 API 也没有出现这个问题。”

经众多网友实测,官方网页 /API 能复现该 bug,概率不高,但多试几次就能出来。第三方平台上的复现率非常高。同时,如果将错误搀入的字符“极”字改为其他的字符,则官方 API 出问题概率下降,但像 VolcEngine API 出问题的概率仍很高。

网友:找到真正的“锅”了

“之前用腾讯元宝调用 DeepSeek R1 生成代码的时候也会把一些字符转换成‘极’,当时还以为是腾讯的锅。”还有网友表示,“DeepSeek 一直有这个问题,只是以前出现的概率低。”

各种找原因,是数据问题?

关于 DeepSeek V3.1 出现这一 bug 的原因,总的来说目前大家主要有三种猜测:

  • Token 连续性假说:认为 FP8 量化或者混合精度训练导致“极”的 Token ID 2577 和省略号的 ID 2576 混淆
  • 数据污染假说:认为预训练或 SFT 遭受了数据污染
  • MTP(Multi Token Prediction)问题:认为推理框架出现了问题

也有开发者认为这是蒸馏“传染”造成的。

“AI 解码师”认为这并非架构缺陷,而是训练数据和蒸馏链条里遗留下来的瑕疵。“这说明 DeepSeek 在迭代过程中,部分数据合成环节没有完全净化。”他认为这背后反映了一个更深层次的问题:大模型并不是在真正理解语言,而是在学习数据分布里的统计规律。如果训练数据中混入了“极长的数组”这种模式,模型就可能把它当成一种“隐含的指令”,而不是单纯的自然语言。