谷歌终于发力了,带来了今年可能最令人惊喜的文生图模型——nano banana。
谷歌在多模态能力上的坚持与深耕再次开花结果。
自三天前以“Nano Banana”之名低调现身后,相关讨论迅速发酵,只因它过于出色。
此模型在LMArena图片编辑模型排行榜上几乎断代式领先,而谷歌官方昨日宣布,nano banana正是出自Google DeepMind实验室推出的Gemini-2.5-Flash-Image-Preview。
Nano banana现居图像编辑排行榜榜首,开箱即用,无论是官方素材还是网友案例,在一致性与功能性上都表现惊艳。
全球网络一致好评,盛赞其比任何图像编辑模型都要出色。
不仅一致性强,速度还快,相比gpt-image能实现更精准的编辑,同时,具备完整LLM的理解能力,而非普通CLIP规模模型的认知水平。
访问地址:ai.studio/banana
最直观的感受是,这是一个用嘴和打字就能修改和拼接图片的模型,仿佛回到了初见ChatGPT和Sora的“魔法时代”。
过往AI生图常被诟病每次编辑都如掷骰子,细节失真、角色特征易变。而谷歌对Nano Banana的定位正是保持主体一致性。
谷歌表示,更换背景、视角或色调,画面中的人物与物体都能稳定保持原貌。
另一方面,它还是带推理的图像模型。Nano Banana的提示词精准度达到了新高度,在理解内容方面表现出色。
它不仅能理解图像内容,还能自主理解、处理、添加文字。
支持多轮次编辑与多图叙事能力,用户可持续修改图片,但人物不变,甚至能保留原来的氛围感。复杂功能如“房间布置变化”、“漫画分镜”、“多角色互动”等都能实现。
一句话让模型换视角,上图为原图,下图是俯视视角。
一句话,拳王阿里秒变辛普森。
劈柴从印度老家顺移到谷歌办公室(人物有变化)。
仅去小细节,局部编辑也很稳定。
网友测试表示,让人物转一圈再转回来,变化不大。
动漫领域也表现喜人,给出角色和手绘图就能控制姿态。
生成角色三视图后,漫画也能稳定生成。
多次编辑让成图更稳定。
本文由主机测评网于2026-04-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260440239.html