AI文生图模型测评：谁是最强画手？

AI技术的渗透正逐步扩展至各个领域，插画网站纷纷添加“AI生成”标签，成为行业新趋势。

从艺术视角来看，尽管AI生成的图片颇具争议，但在工作和学习中，其高效性却不容小觑。

当前，多模态大模型领域支持文生图的模型数量正呈指数级增长。

为帮助大家解决选择难题，本次我们精心挑选了6款模型进行测评。

参赛选手包括：腾讯混元、智谱CogView-4、通义千问、即梦、可灵以及Gemini 2.5 Flash Image。

其中，nano-Banana在LMarena上的爆火表现令人印象深刻，其背后正是8月27日Google发布的Gemini 2.5 Flash Image。

在测评之前，先做个说明：

在美术方面，我实属门外汉。

因此，我们将避开复杂的理论及晦涩的美术史，仅从普通人的视角出发，借助AI的评分标准，来评价这些作品的“美观性”。一家之言，仅供参考。

01 第一维度：基础美学与真实感

考察目标：AI的绘画基本功，即画面是否美观、真实。

题目：傍晚阳光下的少女

Prompt: 超写实照片，一个有雀斑的年轻女子，面带微笑，在黄金时刻坐在窗边，温暖的阳光穿过她的头发，电影感光线，8K，高细节。

评分标准：

AI文生图模型测评：谁是最强画手？ AI生成文生图模型测评概率引导第1张

测评结果：

AI文生图模型测评：谁是最强画手？ AI生成文生图模型测评概率引导第2张

腾讯：人物皮肤质感过于光滑，缺乏自然瑕疵。

智谱：皮肤过于光滑，雀斑形状和分布均匀刻意，显得不自然。

千问：双手比例和形态非常不自然，缺乏写实感。

即梦和可灵：表现非常出色，接近完美。

Gemini：皮肤质感过于光滑细腻，但写实感稍差。

总体来说，各模型在人物塑造方面各有千秋。虽然部分模型存在瑕疵，但整体观感尚可。