一款名为Nano-Banana的神秘AI模型突然走红网络,但随之而来的是大量仿冒网站,让人难以分辨真假。
最近,人工智能圈子里悄然兴起一个名为Nano-Banana的模型,它专注于图像生成与编辑功能,引发广泛关注。
最初,该模型在LMArena平台的“Battle”模式中被用户偶然发现,但并未出现在公开排行榜上,也没有官方开发者正式认领其归属权。
然而,许多网友根据一系列线索推测这可能是谷歌内部研发的模型。
上周二,谷歌AI Studio产品负责人Logan Kilpatrick在社交平台X上发布了一个简单的香蕉表情符号,似乎暗有所指。
谷歌DeepMind产品经理Naina Raisinghani也发布了一张图片,类似意大利艺术家Maurizio Cattelan在2019年创作的胶带香蕉艺术品,进一步引发联想。
此外,谷歌过去曾将其小型模型命名为“Nano”,而且Nano-Banana生成图像的风格与Google的Imagen或Gemini系列颇为相似,这些迹象都指向谷歌的可能性。
综合这些信息,似乎都在暗示Nano-Banana出自谷歌之手。
该模型在文本编辑、风格融合和场景理解等方面表现出色,还支持上传两张图片并输入提示词,以融合其中的元素。
例如,上传一摞书和床头柜的图片,输入提示词“将横放的书立起来,放到书挡之间的柜子上”,它就能准确理解并执行。
上传模特照片和棒球帽图片,输入“给女士戴上棒球帽”,Nano-Banana能完美保留帽子上的刺绣细节,同时保持光线和视角的一致性。
在产品摄影、场景搭建和广告设计等商业应用中,Nano-Banana的表现也相当稳定可靠。
当然,Nano-Banana并非完美无缺。在某些情况下,生成的图像可能出现反射、光照逻辑或物体位置不一致等问题,人物的手指偶尔也会出现畸形。
仔细查看生成的书籍图片,会发现书名部分有类似“鬼画符”的瑕疵。
由于目前没有官方API或正式网站,用户只能通过LMArena平台随机体验该模型,这意味着每次使用都靠运气,体验并不稳定。
更令人啼笑皆非的是,网络上涌现出许多假冒网站,声称提供Nano-Banana服务,让不少用户真伪难辨。
我们进行了一次亲身测评。
打开LMArena官网,选择Battle模式,可以直接输入提示词生成图像,也可以上传图片并输入提示词进行AI编辑。
官网链接:https://lmarena.ai/
页面上会匿名显示两个模型同时生成图片,只有用户选出质量最佳的一张后,平台才会揭示对战双方的身份。
首先测试文生图功能。
输入提示词:呈现一幅宝丽来风格的肖像照。图中有一位化妆师,留着长而松散的卷发,穿着 oversized 服装。她面容精致,姿态随意,对着镜头比出和平手势,营造出自由氛围。图像略带颗粒感,色彩鲜艳迷人,比例1:1。
第一幅是Nano-Banana生成的作品,背景中有眼影盘、指甲油等化妆用品,更贴合“化妆师”身份,人物动作和服装细节自然,手部无瑕疵;第二幅由ChatGPT生成,背景较简单,大拇指部分略有虚化。
接下来测试图片编辑功能。
上传一张旧金山阿拉莫广场的野餐照片,输入提示词:在公园中添加一些人形机器人,让它们与环境融合。
初看以为Nano-Banana没有响应,但仔细在画面右侧发现了一个行走的类人机器人,它完美融入环境,毫无违和感。
上传一张人物摄影照片,让Nano-Banana逆向描绘其创作过程。
提示词:展示布景搭建前的场景,模特坐着刷手机,一位女士在背后整理她的头发,一个男人站在梯子上悬挂背景幕布,露出后面的工作室。
有网友用Nano-Banana让碧梨和迈克尔·杰克逊进行跨时空自拍:
我们也尝试类似操作。上传马斯克和奥特曼的照片,输入提示词:两人开心地自拍。
Nano-Banana确实生成了自拍照,马斯克的形象和动作几乎无误,但奥特曼的形象变化较大。
为了更全面评估,我们再次尝试,结果仍然不理想。
继续增加难度。上传扎克伯格、马斯克的肖像照和一张风景照,让Nano-Banana将两人自然融入风景中。
Gemini 2.0 flash生成的效果难以辨认名人,而Nano-Banana将二人完美融入环境,不过在手指等细节上仍有瑕疵。
如果将Nano-Banana与谷歌的Veo3结合,会碰撞出怎样的火花?
@a16z合伙人Justine Moore探索了一个新工作流,用于制作较长视频。
例如,创建一个游戏或电影中的潜行任务场景,角色从昏暗博物馆盗取名画,触发激光警报。
她还分享了制作教程:提取第一个视频片段的最后一帧,上传到LMArena的Nano-Banana,提示生成下一个场景(如“角色转向走廊”),然后用Veo 3将新生成的帧动画化。
X网友@ZHO_ZHO_ZHO发现了另一种有趣用法——将插画转化为手办模型。
上传一张图片,输入提示词:将这张照片变成角色手办。背景放置一个印有角色图像的盒子,电脑屏幕显示Blender建模过程。盒子前添加圆形塑料底座,手办站立其上。确保PVC材质清晰可见,场景设为室内。
据该博主测评,Nano-Banana生成的图像几乎看不出AI痕迹,五官和细节保留完好,真实感强。
再用Veo3将其制作为8秒视频。提示词:用双手拿起手办,展示各个角度。
评论区不少网友也尝试这一工作流。例如,哪吒双手抱拳的手办:
还有哆啦A梦手办,正面看尾巴正常,但转身后形态变化:
我们也进行了复刻。上传Q版插画图片,输入相同提示词。
效果如下:
最后打开Gemini 2.5 Pro,选择Video功能,上传生成的图片,输入提示词,等待约1分钟,即可得到一段8秒视频。
上周末,谷歌Veo 3向所有Gemini用户免费开放,供体验AI视频生成功能。
不过,这项免费活动仅持续到太平洋时间8月24日晚上10点(北京时间8月25日上午1点)。期间,免费用户每天最多生成3个8秒视频片段,每个视频包含自动生成音频。
通常,Veo 3的视频生成功能仅对Google AI Pro或Ultra订阅用户开放。Pro用户每天可生成3个视频,Ultra用户配额为10个。
感兴趣的用户不妨抓紧体验。
https://x.com/ginacostag_/status/1959234207127134340
https://x.com/venturetwins/status/1957155767888548160
https://x.com/techhalla/status/1959186906115354692
https://x.com/ZHO_ZHO_ZHO/status/1958550998815023573
本文由主机测评网于2025-12-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20251212730.html