当前位置:首页 > 科技资讯 > 正文

AI图像生成:从完美到“不完美”的进化

你可还记得,几年前人类初次目睹 AI 生图时的惊愕?

起初,我们靠判断那些违背物理常识的“一眼假”,比如生成的手指数量不对又变形,生成的人类永远无法好好吃面条。随着 AI 发生常识性错误的几率逐渐降低,它走向了另一个“极端”,生成的人像皮肤过于光滑、光线过于扁平、构图过于端正,乍一看像是经过影楼处理的照片。“这不像是人拍的”,对此,我们还能凭借经验主义发出这样的警觉。

AI图像生成:从完美到“不完美”的进化 AI图像生成 不完美 人类认知 信任阈值 第1张

乍看很真实,细看却太过完美光滑|APOB AI

然而,朋友们,在这个人机难辨的时代,任何识别经验都可能随时被淘汰。

新的 AI 图像模型开始主动向“差一点”的方向转变。它们学会了模仿手机摄影中出现的不完美质感:对比度不高、锐化过头、阴影被硬生生拉亮、构图带点随意,甚至有点模糊。

也就是说,AI 不再追求生成“最好的照片”,而是试图生成“你会拍出来的那种照片”。而正是这些“瑕疵”,让图像突然变得可信了。

这个变化节点透露出一丝更加“危险”的气息,AI 正在学习如何显得不那么完美,就像人类一样。

AI:我装的

真实世界从来不是高清、完美、对称、干净的。我们之所以相信一张照片是真的,并不是因为它好看,而是因为它符合我们记录现实的方式。

早期的 AI 图像,最大的破绽是一种诡异的“完美”。图像的每一颗像素都太滑、太亮、太干净,就像把“磨皮”开到最大后又抹了层油和蜡,人像宛如蜡像,不生动。

AI图像生成:从完美到“不完美”的进化 AI图像生成 不完美 人类认知 信任阈值 第2张

去掉“油蜡感”是 AI 生图拟真的重点|X

而今天训练模型的人在教 AI “搞砸”。

以最近 Gemini 里集成的 Nano Banana 为例。它生成的图像里,有着明显的过度锐化,对比度拉得死高,暗部细节丢失,甚至还有那种因为传感器太小而产生的特有噪点。

我们知道因为手机能承载的传感器很小,为了弥补光学上的先天不足,手机厂商会使用多帧合成算法,“暴力”地提升阴影亮度,锐化边缘以制造“清晰”的假象。

AI图像生成:从完美到“不完美”的进化 AI图像生成 不完美 人类认知 信任阈值 第3张

OpenAI 刚升级的 ChatGPT Images,在宣传片中也主打“真实拍摄感”|OpenAI

当 AI 图像不再试图渲染物理世界真实的光影,转而去渲染“手机摄像头里的世界”,用 The Verge 的评论,这叫“AI 学会了巧妙地绕过恐怖谷”。

AI图像生成:从完美到“不完美”的进化 AI图像生成 不完美 人类认知 信任阈值 第4张

这跟手机拍的风景照有什么区别?|The Verge

“绕过恐怖谷,巧妙地”

你有没有发现,聊天机器人也变了?

从一开始那个“高智力低情商”的“伪人”——说话滴水不漏,姿态居高临下,态度理性生硬,变得会犹豫、会共情、主动暴露脆弱。

有限的理性,偶尔的词不达意,语气中不可避免地透露出个人情绪...这些才是正常人类的表达。

AI图像生成:从完美到“不完美”的进化 AI图像生成 不完美 人类认知 信任阈值 第5张

去问 AI,AI 也会说这是一种“后台策略”|ChatGPT

所以当一个 AI “有意”展露出这些,反而比一个绝对理性、稳定、客观中立的“聊天对象”更能拉近距离感。对此我们下意识的反应是,“挺有个性”、“完了,它好像真的在思考”。

这些“障眼法”背后是一个关键的问题:当 AI 展示不完美时,它到底是在暴露能力的边界?还是在展示能力本身?答案恐怕是后者。

它在判断“什么样的结果更容易被人类接受”:脆弱、迟疑、模糊、噪点?这些过去被视为缺陷的东西,正在变成 AI 博取人类信任的表演策略。

AI图像生成:从完美到“不完美”的进化 AI图像生成 不完美 人类认知 信任阈值 第6张

事实证明,一直以来我们判断真实与否本身就带着人类的局限。

就像人类看不到红外与紫外光,听不到 20Hz 以下的低频。我们感知到的“现实”,本就只是一个被生理和心理共同裁剪过的版本。

从这一点上来说,比剥离出 AI 生成但符合人类预期的虚假更难的是,逼迫人类承认判断主观和认知局限。

AI 绕过恐怖谷的新策略,不是全力拟真,追求零差错,而是精准地设计出恰好落在我们信任阈值之内的“真实”。