AI技术的渗透正逐步扩展至各个领域,插画网站纷纷添加“AI生成”标签,成为行业新趋势。
从艺术视角来看,尽管AI生成的图片颇具争议,但在工作和学习中,其高效性却不容小觑。
当前,多模态大模型领域支持文生图的模型数量正呈指数级增长。
为帮助大家解决选择难题,本次我们精心挑选了6款模型进行测评。
参赛选手包括:腾讯混元、智谱CogView-4、通义千问、即梦、可灵以及Gemini 2.5 Flash Image。
其中,nano-Banana在LMarena上的爆火表现令人印象深刻,其背后正是8月27日Google发布的Gemini 2.5 Flash Image。
在测评之前,先做个说明:
在美术方面,我实属门外汉。
因此,我们将避开复杂的理论及晦涩的美术史,仅从普通人的视角出发,借助AI的评分标准,来评价这些作品的“美观性”。一家之言,仅供参考。
考察目标:AI的绘画基本功,即画面是否美观、真实。
题目:傍晚阳光下的少女
Prompt: 超写实照片,一个有雀斑的年轻女子,面带微笑,在黄金时刻坐在窗边,温暖的阳光穿过她的头发,电影感光线,8K,高细节。
评分标准:
测评结果:
腾讯:人物皮肤质感过于光滑,缺乏自然瑕疵。
智谱:皮肤过于光滑,雀斑形状和分布均匀刻意,显得不自然。
千问:双手比例和形态非常不自然,缺乏写实感。
即梦和可灵:表现非常出色,接近完美。
Gemini:皮肤质感过于光滑细腻,但写实感稍差。
总体来说,各模型在人物塑造方面各有千秋。虽然部分模型存在瑕疵,但整体观感尚可。
本文由主机测评网于2026-04-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260440381.html