昨晚,一款名为 nano banana 的强大图像生成与编辑模型终于揭开了神秘面纱。不出所料,这款模型来自科技巨头谷歌,并冠以了正式名称:gemini-2.5-flash-image-preview。
据官方介绍,该模型具备「顶尖的图像生成与编辑能力、惊人的人物一致性以及闪电般的速度」,无论是技术性能还是用户体验都令人惊叹。
从名称可以推测,谷歌应该还有一个非 flash 版本的 gemini-2.5-image 模型,其性能更加卓越,但速度可能稍慢。
目前,gemini-2.5-flash-image-preview 已在 Google AI Studio 和 Gemini API 上提供预览,用户可以免费试用。
该模型支持 32k 上下文,提供温度调节(可控制模型的创造力)以及一些高级设置。然而,遗憾的是,它尚不支持中文输入执行图像生成和编辑,而是会给出文本响应。
在 Gemini 中,用户只需选择 2.5 Flash 并使用合适的提示词,即可使用该模型。
价格方面,该模型输入/输出文本的价格为 0.3/2.5 美元,输入/输出图像的价格为 0.3/30 美元。截至知识截止时间 2025 年 6 月。
经计算,该模型生成每张图像的成本约为 0.039 美元(约 0.28 元),远低于 OpenAI 的图像生成成本。
在功能方面,谷歌官方博客强调他们特别注重在不同图片间保持人物形象的一致性。
「我们深知,当你编辑自己或熟悉的人时,即使是微小的差异也会显得突兀。正因如此,我们的最新更新专注于此,让你的朋友、家人甚至宠物在不同年代或场景中都能保持一致的外观。」
只需一张照片和相应的修改指令,该模型就能为你和宠物打造独特的个人风格。它能将你带入任何你想象的世界,同时保持你的真实形象。完成编辑后,你还可以将照片再次上传到 Gemini,将其转化为有趣的视频。
谷歌还分享了一些玩法示例。
换装或换场景:上传一张人物或宠物的照片,该模型会在任何新场景下保持他们的外貌一致。你可以尝试不同的服装、职业,甚至看看你在另一个年代的样子 —— 但始终还是你自己。
地址:https://aistudio.google.com/apps/bundled/past_forward
合成照片:你可以上传多张照片,将它们融合成一个全新的场景。例如,将你和狗狗的照片合成在篮球场上。
多轮编辑:你可以不断修改 Gemini 生成的图像。例如,从一间空房间开始,先刷墙再加书架、家具或茶几。Gemini 会只改动你指定的部分,同时保留其余部分。
gemini-2.5-flash-image-preview 上线后迅速在排行榜上崭露头角。
在 Artificial Analysis 图像编辑排行榜上,该模型直接跃升至第一位,获得了 1212 的 ELO 分数。
...
本文由主机测评网于2026-04-25发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260440232.html