隐姓埋名的小香蕉 悄悄吊着打所有生图模型!

隐姓埋名的小香蕉 悄悄吊着打所有生图模型!

文章来源:智汇AI    发布时间:2025-09-01

前一阵子,大模型竞技场 LMArena 里面悄咪咪地出现了一个神秘的图片模型 —— nano-banana,在一众生图模

暂无访问

前一阵子,大模型竞技场LMArena里面悄咪咪地出现了一个神秘的图片模型——nano-banana,在一众生图模型里面乱杀。

这个小香蕉无名无姓,可一旦在LMArena抽到它,对手必被吊打。

这个神秘的模型在生图一致性上强得惊人,对提示词的理解和完成度也好得可怕。大伙儿你一票我一票,迅速把它送上了榜单第一位。

就在众人纷纷猜测新模型到底出身哪个高门大户的时候,谷歌AIStudio的产品Leader跳出来发了一个香蕉,暗戳戳地认领了nano-banana。

而就在昨天,nano-banana终于正式上线谷歌AIStudio,直接去Gemini那里就能玩,不用竞技场费事抽卡了。

谷歌在官方博客里是这么秀肌肉的:开局一张脸,以后不管是啥场景,啥服装,啥表情,都能让人一眼看出来你还是你。

把几张照片搓在一起,生成的结果既能保证原来的形象不崩,又能保证新图片看起来不违和。

还能多轮对话改同一张图,每次只改一点点,其它部分就像是妈生原图一样,丝毫不变。

官方的案例看起来是挺吊的,还没玩上的差友也别急,咱这就带大伙儿一起体验一下。

为了感受一下其它模型和nano-banana的差距,我们先上LMArena去抽了几波卡。

结果是,一共抽了十几轮,只要谜底里有banana,你一定会盲选banana。。。有些对比还是非常惨烈的。

像是让人物手里加一根香蕉,右边seededit的手崩了,香蕉的颜色也过于鲜艳,和整体画风不搭,但左边基本挑不出啥毛病。

再比如让鲁迅不要抽烟改拿笔,右边这个细节变了一堆不说,笔头还冒着烟呢。

这么看来,nano-banana比现在的生图模型都强是没啥疑问的。但它具体强在哪些方面呢?我们又去谷歌Studio有针对性地测了测。

先说结论,我们觉得nano-banana最强的点,是它对图片有了更深入的理解,保证了一致性。而在强一致性的基础上,修图、换风格、做3D手办。。。它非常全面,啥都干得挺好。

比如这种一键试穿,需要把平铺的各种服饰P到人的身上,而nano-banana对细节的把控非常到位。

鞋本来提供的是侧面图,但它画出了正面的样子。服饰上各种logo拼的都是对的,甚至T恤上原本镜像的‘SAINTLAURENT’,在生图的过程中也变回来了。

我们还试了试人脸的不同角度生成,这个效果是真的很厉害。

下面这三张图,只有第一张是真实照片,后面两张都是生成的。

这种面部方向的调整在老模型里是很难实现的,因为要通过一张平面图理解一张立体的脸各个角度长啥样很难,但nano-banana的完成度也非常高。

另外,我们还测了一些合照拉郎配。

可以看得出,在这种合照里,它做的不只是把两个人物拼在一起,而是学习到了面部特征。这样生成的新图片即使表情不太样,还是能让人一眼看出这是小马小札。

还有大伙儿最爱的3D手办系列,分分钟把100多斤的火锅压缩成茶杯犬,化身桌面可爱小摆件,火锅群里的同事们纷纷求出货。

最牛的还属这一张——火锅前阵子右后腿皮肤病剃秃了一块,而生成的图片居然注意到了这一点,一致性真拉满了。

不过有一说一,nano-banana的图像风格变换比较中规中矩,倒是没啥特别的。

但在这个过程中,我们发现它不光在处理图片,还在偷偷“认人”。

像是下面这张图,在我们没有告诉谁是谁的情况下,它还是认出来左边是搞火箭的马斯克,右边是META的扎克伯格。

我们又试了几个地标开盒,看看它有没有GPT那样的推理能力。

但实际上它只在地标建筑物上比较好使,更像是图像识别+记忆检索,只能说有一点推理能力,但不多。

左nano-banana答错,右GPT5Thinking答对

除了上述的优点,它的缺点其实也不少。。。最大的问题就是,谷歌好像给它做了不少安全性调教,经常这也不行,那也不行,有时候真摸不清哪个关键词又触犯天条了。

其次是对提示词要求比较高,往好了说,是nano-banana对提示词的遵循能力强,但实际上对用户来讲,得多花不少时间打磨提示词,有点折磨。

谷歌自己也表示,别让Gemini猜你的心思,有啥想要的尽管说出来。

所以要是出来的效果不好,写提示词的时候就得尽量详细一些,什么要动,什么不要动通通列明白,才能保证强一致性。

最后,比起咱心目中的P图白月光FLUX,它在局部小范围修图上效果还是差了一点,所以还是建议大伙儿精修找FLUX,上面各种整大活儿再用nano-banana。

左原图,中nano-banana,右FLUX

总的来说,nano-banana强就强在它对图片的理解能力是目前最好的,而且各种任务上的一致性都不错,没有大短板。

更大的好消息是,小香蕉已经被整合进了2.5Flash版本,即使没有pro会员,免费的账户也可以使用。

只要左上角选择2.5Flash,对话框tools选择Image即可。

LMAreana上也依然可用,只要prompt开头输入“使用nano-banana模型生成”,有极高概率可以抽到。

或者有些整合网站像是LibLib,Fal-ai等等也有第三方提供的nano-banana。

感兴趣的差友赶紧去试试吧,欢迎回来评论区返图哦。

相关推荐