在红点创投的播客Unsupervised Learning最新一期节目中,红点创投合伙人Jacob Effron与Google研究员Nicole Brichtova和Oliver Wang就Nano Banana展开了深入对话。他们讨论了该模型如何凭借前所未有的“角色一致性”特性,在发布后迅速走红。
Nano Banana于8月26日“匿名”发布,后被证实为谷歌的Gemini 2.5 Flash Image模型。这款模型的成功不仅带动了Gemini APP下载量的激增,还使其攀升至全球应用商店榜首。据Appfigures数据显示,该应用在九月份下载量环比增长了45%,截至当前,本月下载量已达到1260万次,远超八月份的870万次。
在节目访谈中,Nicole Brichtova和Oliver Wang不仅分享了当前模型的局限性、安全策略,还探讨了如何将模型融入创意工作流程,以及AI图像发展的早期阶段和未来趋势。
Jacob Effron问及他们最初认为哪些用例会最受欢迎时,Nicole提到角色一致性和能在新场景中看到自己让她尤为兴奋。例如,通过模型生成不同场景下的自己,如通缉海报中的形象、考古学家的形象等。
此外,他们讨论了模型的未来发展方向,包括提高分辨率、支持透明背景以及改进文本渲染等。Oliver Wang还分享了模型如何结合语言模型的世界知识,以提供更智能的服务,如生成解释图片等。
以下为「明亮公司」编译的访谈正文(有删节):
在访谈中,Nicole(左)、Oliver(中)与主持人Jacob(右)深入探讨了Nano Banana的成功原因、未来发展方向以及AI图像模型的潜力。
Jacob:非常感谢你们接受这次访谈。我一直很期待与你们探讨Nano Banana。感觉它已经成为我整个Twitter动态的一部分。
今天我们将探讨多个话题。首先,你们在产品发布前就已接触并体验了它。我很好奇,你们最初认为哪些用例会最受欢迎?现在发布后,实际情况又如何?
Nicole:角色一致性让我尤为兴奋。通过模型,我能在各种新场景中看到自己,如通缉海报、考古学家的形象等。
我们创建了一个包含我的脸和团队其他成员的评估数据集,每当我们开发新模型时都会用它进行测试。
Jacob:这简直是AI领域的最高荣誉了。
Nicole:我真的很兴奋。角色一致性给了人们一种全新的方式来想象自己。
我们还看到很多人把自己变成了手办,这是非常受欢迎的用例之一。另一个让我感到惊喜的用法是为老照片上色,这非常有情感价值。
Jacob:这很有趣。我相信看到大家的各种用法也是你们的乐趣之一。你们在Twitter上一定收到了很多功能请求吧?
Nicole:是的,最常见的是请求更高分辨率和支持透明背景。
Jacob:你们认为图像模型改进的下一个前沿是什么?
Oliver:模型最令人兴奋的一点是它开始接受更难的问题。例如,有人用它来重新装修房间,但自己没有主意,让模型给出建议。
Jacob:你们如何考虑为不同用户打造产品?
Nicole:对于普通消费者来说,易用性极其重要。我们现在正在改进视觉引导用户的方式,未来甚至可能通过手势来编辑图片。
Oliver:我们还发现社交分享在解决“空白画布”问题上很重要。
Jacob:你们对未来有什么新型设计界面感到兴奋吗?
Nicole:我希望各种模态能融合在一起,界面能根据任务自动切换最合适的方式。
Oliver:我最喜欢的高级用例是视频相关的。例如,结合视频模型可以更快地构思、规划镜头。
Oliver:图像领域小团队也能做出顶级模型,但未来需要大型团队同时训练强大的语言和图像模型。
本文由主机测评网于2026-04-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260441537.html