Nano Banana Pro(官方也称为 Gemini 3 Pro Image)于昨日晚间正式亮相。
这一模型基于 Gemini 3 Pro 架构打造,在多模态处理和逻辑推理方面表现更为出色,例如文本渲染的精确度有了显著提升;
它融入了最新的知识库,并整合了 Google 搜索功能,能够先对用户提示进行检索,从而进一步增强生成内容的相关性和真实性;
支持高保真图像生成(提供2K/4K输出分辨率),用 Google 自己的话说,从一个“创意玩具”演进为“专业级”、“工作室级别”的强大工具。
我们通过一系列实际案例进行了测试,看看是否真如 Google 所描述的那么“惊人”。
提示词:生成一张超写实、高清晰度的肖像画。画面内容是《VOGUE》杂志封面,包括杂志的标志和文字。封面有一位年轻女子,背景为摄影室内。她穿着一件华丽的黑色礼服,直视着观者,神情专注。她的右臂抬起,手部分触碰着她的脸侧,同时,右手手腕还有一块 Apple Watch。她的金色头发飘逸,中分造型。
Nano Banana Pro 支持2K/4K 超高分辨率输出,即使放大查看,细节依然清晰可见。图像的皮肤质感、发丝纹理以及人物的光线处理,均已达到专业摄影棚的水准。
随后,我上传了一张个人照片,要求 Nano Banana Pro 将杂志封面的人物替换为我,其他元素保持不变。
脸部肤色虽然略显明亮,但考虑到原图需要打光效果,这一处理也合情合理。
提示词:生成一个啤酒的海报宣传图。画面主体是阳光、沙滩,然后一瓶冰冻的玻璃瓶啤酒放在其中,瓶身上有许多小水珠。画面比例为 3:4,分辨率为 2K。
上一代模型已经令人惊喜,但存在一个小问题:生成图像的比例固定,如需调整,必须后期裁剪。
在 Nano Banana Pro 中,确定好主视觉后,即可轻松进行画面延展。
提示词:接着帮我基于这个海报延展。我需要 16:9、21:9、1:1 还有 9:20.9 比例(大部分全面屏手机的屏幕比例)的图片,分辨率为 2K。
随后,Nano Banana Pro 会生成多种比例图像供您选择。好了,我宣布,电商设计师可以尽情享受高效创作了。
“一致性”堪称 Nano Banana 的招牌特性。在 Pro 版本中,这一能力升级至最多支持使用 14 张参考图像,同时保持多达 5 个人物的一致性与相似度。
例如官方提供的示例,
Prompt: A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor. They are all facing forwards, watching a vintage, wooden-boxed television set placed on a low wooden table in front of the sofa. The room is dimly lit, with warm light from a window on the left and the glow from the TV illuminating the creatures" faces and fluffy textures. The background is a cozy, slightly cluttered living room with a braided rug, a bookshelf with old books, and rustic kitchen elements in the background. The overall atmosphere is warm, cozy, and amused. |Google
那么,您或许可以尝试,将自己与多位明星合成在一张“魅力新广州”的合影中。
提示词:将这四个人放在一张图像中。她们看起来像是一张自拍,看起来像是随兴而为。背景图片是最后一张,她们在这里开心地与地标建筑合影留念。整体的图片颜色和光线看起来都很自然,她们看起来自然地来到这里旅行。
然后您会得到(我被美女包围了),
这里不得不提一句,谷歌自家的模型居然未使用 Pixel 设备!
多轮对话、局部调整等功能,结合画面质量、精度和细节刻画方面的提升,使 Nano Banana Pro 朝着“专业级别”工具迈进,例如可轻松改变镜头角度、光线效果、画面色调等。
Nano Banana Pro 在工作流中整合了自家的 Veo 3 和 Google Slides,前者可将生成的图像作为关键帧来生成视频;后者则可快速完成 PPT 排版。
以上功能还只是“基础本领”。Nano Banana Pro 与搜索集成后,相当于拥有了“外挂”,能基于提示词先进行检索和核查,确保生成图像中的信息是最新且有理有据的。
例如,帮我生成一个宫保鸡丁制作的流程步骤图,采用插画风格。
再如,生物老师要求“帮我生成一个介绍植物光合作用的流程步骤图,写明每一步的反应和参与的结构,采用插画风格。”
我看到 X 网友 @CaomuQ625 生成的“Windows 截图”,这曾经难倒了几乎所有 AI 模型,而 Nano Banana Pro 处理起来却游刃有余。
提示词:生成一张 Windows 11 操作系统的桌面截图,截图中已打开 Google Chrome 浏览器,并在浏览器窗口内展示 YouTube 网站上 Mr. Beast 的视频缩略图。|X.com截图
您会发现 Nano Banana Pro 在生成界面时,理解了组件之间的逻辑关系及其代表含义,而非简单地将各个部分拼凑成一张“看似UI的图片”。
接着我想,生成一个游戏截图呢?
提示词:生成一个正在 macOS 上用游戏模拟器玩《超级马里奥》的截图。
然后,只要您愿意,就可以让“野兽先生”进入马里奥的世界。Nano Banana Pro 的逻辑推理能力着实让我大吃一惊。
它在思考过程中意识到 Mr. Beast 是一个真实人物,如何自然融入?于是学习了马里奥游戏的画面信息,将卡通化的野兽先生置入其中,而非简单地进行“缝合”。甚至,为了匹配 Mr. Beast 头像的大小,它还将马里奥的身体等比例放大——它似乎在真正理解所要生成的内容。
而且,我当时仅提示“生成一个正在 macOS 上用游戏模拟器玩《超级马里奥》的截图”,并未具体指定模拟器软件。然而,它居然真的找到了能在 Mac 上运行的街机游戏模拟器软件 OpenEmu,甚至获取了其正确图标(这还是我认识的 AI 吗?)
同时,基于 Gemini 3 Pro 的多模态推理能力,Nano Banana Pro 的文字渲染准确性大幅提升。Google 毫不谦虚地宣称自己在这一领域处于最先进水平。
提示词:李商隐的《无题》是一首以男女离别为题材创作的七言爱情诗,请帮我生成一张中国风的插画,主题是一位女子在家中,站在窗边,窗外百花凋零,看着远处的青鸟流泪,并在画面合适的地方附上这首古诗。
中文生成告别了“鬼画符”。在测试其他例子时,我发现中英文混排时,中文也能确保正确无误。
不知您是否注意到,上述案例中的部分提示词并不冗长,甚至有些模糊。我在测试过程中发现,Nano Banana Pro 甚至能理解我的一些抽象表达。
这得益于 Gemini 所具备的“世界知识”。
Nano Banana 核心团队曾指出,“有时我们的指令本身定义不够清晰,或者我们对现实的某些理解并不准确,而 Gemini 拥有的知识可能与我们视角之外的世界更为一致。”
我突然想到,此前许多没有堂食的外卖商家使用 AI 生成店铺图片,挂在外卖平台上,结果引发了更多负面反馈。
我尝试让 Nano Banana Pro 生成一张类似图片,看看效果如何。
提示词:生成一张咖啡店的照片,店名为果壳咖啡。咖啡店整体现代装修风格,坐落在城市转角,干净整洁。门店一侧是透明落地玻璃窗,另一侧是适合顾客落座的临街座位,有人在这里看书,也有人在店里喝咖啡聊天。
暂且不论“装修风格如何”,左边落地窗上男子的倒影是否也让您感到些许惊艳?
记得一个多月前,母亲发来一张照片,那是她1979年高中毕业时的合影。她是乡里仅有的两位女高中生之一,那是她人生的高光时刻。
如今她年过六旬,希望我用 AI 为老照片上色,以作怀念。但您知道,这种大集体合影对 AI 而言堪称“噩梦”,不是将面部改得“面目全非”,就是整体色彩显得十分怪异。
恰逢今日 Nano Banana Pro 上线,我再次尝试:
效果令人惊叹,母亲看到照片后,难掩喜悦之情,声音中带着笑意:“真棒,真棒......”那一刻,我仿佛看到了1979年那位意气风发的少女。
目前,Nano Banana Pro 已正式上线。
直接打开 Gemini App 或网页版,选择“工具-制作图片”,然后选用 Gemini 3 Pro 的“思考”模型,即可直接调用。免费版用户也可使用,但有一定限额。
此外,谷歌自家的 Vertex AI Studio(进入网页后,选择“gemini-3-pro-image-preview”即 Nano Banana Pro),或 ZenMux 这类第三方 AI 聚合网站,也已提供 Nano Banana Pro 的预览版。
未特殊标注的图片均为作者生成
本文由主机测评网于2026-01-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260120721.html