当前位置:首页 > 科技资讯 > 正文

AI文生图模型测评:谁是最强画手?

AI技术的渗透正逐步扩展至各个领域,插画网站纷纷添加“AI生成”标签,成为行业新趋势。

从艺术视角来看,尽管AI生成的图片颇具争议,但在工作和学习中,其高效性却不容小觑。

当前,多模态大模型领域支持文生图的模型数量正呈指数级增长。

为帮助大家解决选择难题,本次我们精心挑选了6款模型进行测评。

参赛选手包括:腾讯混元、智谱CogView-4、通义千问、即梦、可灵以及Gemini 2.5 Flash Image。

其中,nano-Banana在LMarena上的爆火表现令人印象深刻,其背后正是8月27日Google发布的Gemini 2.5 Flash Image。

在测评之前,先做个说明:

在美术方面,我实属门外汉。

因此,我们将避开复杂的理论及晦涩的美术史,仅从普通人的视角出发,借助AI的评分标准,来评价这些作品的“美观性”。一家之言,仅供参考。

01 第一维度:基础美学与真实感

考察目标:AI的绘画基本功,即画面是否美观、真实。

题目:傍晚阳光下的少女

Prompt: 超写实照片,一个有雀斑的年轻女子,面带微笑,在黄金时刻坐在窗边,温暖的阳光穿过她的头发,电影感光线,8K,高细节。

评分标准:

AI文生图模型测评:谁是最强画手? AI生成 文生图 模型测评 概率引导 第1张

测评结果:

AI文生图模型测评:谁是最强画手? AI生成 文生图 模型测评 概率引导 第2张

腾讯:人物皮肤质感过于光滑,缺乏自然瑕疵。

智谱:皮肤过于光滑,雀斑形状和分布均匀刻意,显得不自然。

千问:双手比例和形态非常不自然,缺乏写实感。

即梦和可灵:表现非常出色,接近完美。

Gemini:皮肤质感过于光滑细腻,但写实感稍差。

总体来说,各模型在人物塑造方面各有千秋。虽然部分模型存在瑕疵,但整体观感尚可。