当前位置：首页 > 科技资讯 > 正文

阿里Qwen-Image 2.0新登场：超长指令与真实感图像生成

主机测评网
科技资讯
2026-07-04
751

阿里Qwen-Image 2.0新登场：超长指令与真实感图像生成 Qwen-Image 2.0 超长指令图像生成真实感第1张

字节的图像生成模型发布不久，阿里也迅速推出了新模型！

智东西在2月10日报道，阿里巴巴发布了新一代图像生成基础模型Qwen-Image 2.0，该模型支持长达一千个token的超长指令、达到2k分辨率，并采用更轻量的模型架构，模型尺寸远小于Qwen-Image 1.0的20B，从而提升了推理速度。

智东西对阿里Qwen-Image 2.0、字节Seedream 5.0 Preview以及谷歌Nano Banana Pro进行了对比，发现Qwen-Image 2.0在长指令遵循和长文本渲染上表现优秀，但在图像生成的真实感上略逊于Nano Banana Pro。

Qwen-Image 2.0的升级重点在于文字渲染。在下方的AB测试中，文字的字体、排版、格式等由一则包含888个token（近1000个中英文字词）的超长提示词定义，而Qwen-Image 2.0能很好地还原。

阿里Qwen-Image 2.0新登场：超长指令与真实感图像生成 Qwen-Image 2.0 超长指令图像生成真实感第2张

Qwen-Image 2.0还能用毛笔字渲染《兰亭集序》全文，并确保文字和画面的协调，文字不遮挡山水景色和人物。细看文字部分，虽然有些渲染失败的文字，但占比已很低。

阿里Qwen-Image 2.0新登场：超长指令与真实感图像生成 Qwen-Image 2.0 超长指令图像生成真实感第3张

Qwen-Image 2.0还支持一次性渲染多个子图并保持主体一致性。如下图所示，Qwen-Image 2.0一次性生成了包含24个画面的漫画，人物和画风连贯。

针对AI生图的常见“油腻感”问题，Qwen-Image 2.0也做了优化。与前一代模型相比，Qwen-Image 2.0的色彩不会过于饱和，观感更接近实拍。

阿里Qwen-Image 2.0新登场：超长指令与真实感图像生成 Qwen-Image 2.0 超长指令图像生成真实感第4张

阿里在AI盲测平台AI Arena上对Qwen-Image 2.0进行了测试，结果显示该模型在文生图和图生图基准中分别排名第三和第二，但与谷歌的Nano Banana Pro（图中为Gemini-3-Pro-Image-Preview）仍有一定差距。此外，该模型还未与刚发布的Seedream 5.0 Preview进行对比。

阿里Qwen-Image 2.0新登场：超长指令与真实感图像生成 Qwen-Image 2.0 超长指令图像生成真实感第5张