隐姓埋名的小香蕉悄悄吊着打所有生图模型！

隐姓埋名的小香蕉悄悄吊着打所有生图模型！

文章来源：智汇AI 发布时间：2025-09-01

前一阵子，大模型竞技场 LMArena 里面悄咪咪地出现了一个神秘的图片模型 —— nano-banana，在一众生图模

暂无访问

前一阵子，大模型竞技场LMArena里面悄咪咪地出现了一个神秘的图片模型——nano-banana，在一众生图模型里面乱杀。

这个小香蕉无名无姓，可一旦在LMArena抽到它，对手必被吊打。

这个神秘的模型在生图一致性上强得惊人，对提示词的理解和完成度也好得可怕。大伙儿你一票我一票，迅速把它送上了榜单第一位。

就在众人纷纷猜测新模型到底出身哪个高门大户的时候，谷歌AIStudio的产品Leader跳出来发了一个香蕉，暗戳戳地认领了nano-banana。

而就在昨天，nano-banana终于正式上线谷歌AIStudio，直接去Gemini那里就能玩，不用竞技场费事抽卡了。

谷歌在官方博客里是这么秀肌肉的：开局一张脸，以后不管是啥场景，啥服装，啥表情，都能让人一眼看出来你还是你。

把几张照片搓在一起，生成的结果既能保证原来的形象不崩，又能保证新图片看起来不违和。

还能多轮对话改同一张图，每次只改一点点，其它部分就像是妈生原图一样，丝毫不变。

官方的案例看起来是挺吊的，还没玩上的差友也别急，咱这就带大伙儿一起体验一下。

为了感受一下其它模型和nano-banana的差距，我们先上LMArena去抽了几波卡。

结果是，一共抽了十几轮，只要谜底里有banana，你一定会盲选banana。。。有些对比还是非常惨烈的。

像是让人物手里加一根香蕉，右边seededit的手崩了，香蕉的颜色也过于鲜艳，和整体画风不搭，但左边基本挑不出啥毛病。

再比如让鲁迅不要抽烟改拿笔，右边这个细节变了一堆不说，笔头还冒着烟呢。

这么看来，nano-banana比现在的生图模型都强是没啥疑问的。但它具体强在哪些方面呢？我们又去谷歌Studio有针对性地测了测。

先说结论，我们觉得nano-banana最强的点，是它对图片有了更深入的理解，保证了一致性。而在强一致性的基础上，修图、换风格、做3D手办。。。它非常全面，啥都干得挺好。

比如这种一键试穿，需要把平铺的各种服饰P到人的身上，而nano-banana对细节的把控非常到位。

鞋本来提供的是侧面图，但它画出了正面的样子。服饰上各种logo拼的都是对的，甚至T恤上原本镜像的‘SAINTLAURENT’，在生图的过程中也变回来了。

我们还试了试人脸的不同角度生成，这个效果是真的很厉害。

下面这三张图，只有第一张是真实照片，后面两张都是生成的。

这种面部方向的调整在老模型里是很难实现的，因为要通过一张平面图理解一张立体的脸各个角度长啥样很难，但nano-banana的完成度也非常高。

另外，我们还测了一些合照拉郎配。

可以看得出，在这种合照里，它做的不只是把两个人物拼在一起，而是学习到了面部特征。这样生成的新图片即使表情不太样，还是能让人一眼看出这是小马小札。

还有大伙儿最爱的3D手办系列，分分钟把100多斤的火锅压缩成茶杯犬，化身桌面可爱小摆件，火锅群里的同事们纷纷求出货。

最牛的还属这一张——火锅前阵子右后腿皮肤病剃秃了一块，而生成的图片居然注意到了这一点，一致性真拉满了。

不过有一说一，nano-banana的图像风格变换比较中规中矩，倒是没啥特别的。

但在这个过程中，我们发现它不光在处理图片，还在偷偷“认人”。

像是下面这张图，在我们没有告诉谁是谁的情况下，它还是认出来左边是搞火箭的马斯克，右边是META的扎克伯格。

我们又试了几个地标开盒，看看它有没有GPT那样的推理能力。

但实际上它只在地标建筑物上比较好使，更像是图像识别+记忆检索，只能说有一点推理能力，但不多。

左nano-banana答错，右GPT5Thinking答对

除了上述的优点，它的缺点其实也不少。。。最大的问题就是，谷歌好像给它做了不少安全性调教，经常这也不行，那也不行，有时候真摸不清哪个关键词又触犯天条了。

其次是对提示词要求比较高，往好了说，是nano-banana对提示词的遵循能力强，但实际上对用户来讲，得多花不少时间打磨提示词，有点折磨。

谷歌自己也表示，别让Gemini猜你的心思，有啥想要的尽管说出来。

所以要是出来的效果不好，写提示词的时候就得尽量详细一些，什么要动，什么不要动通通列明白，才能保证强一致性。

最后，比起咱心目中的P图白月光FLUX，它在局部小范围修图上效果还是差了一点，所以还是建议大伙儿精修找FLUX，上面各种整大活儿再用nano-banana。

左原图，中nano-banana，右FLUX

总的来说，nano-banana强就强在它对图片的理解能力是目前最好的，而且各种任务上的一致性都不错，没有大短板。

更大的好消息是，小香蕉已经被整合进了2.5Flash版本，即使没有pro会员，免费的账户也可以使用。

只要左上角选择2.5Flash，对话框tools选择Image即可。

LMAreana上也依然可用，只要prompt开头输入“使用nano-banana模型生成”，有极高概率可以抽到。

或者有些整合网站像是LibLib，Fal-ai等等也有第三方提供的nano-banana。

感兴趣的差友赶紧去试试吧，欢迎回来评论区返图哦。

相关推荐

最新收录

沁言AI可以解决什么问题？

沁言AI可以

沁言学术

沁言学术

SVGWave手机版ai工具

SVGWav

ProductScopeAi智能助手下载安装

Produc

Go-with-the-Flow人工智能平台官网

Go-wit

51数字人ai工具免费版下载

51数字人a

CoolBackgroundsai人工智能免费下载

CoolBa

Atoms.Dev智能工具APP最新版下载

Atoms.

SketchGPTAi手机

Sketch

imgAK

imgAK

33字幕图手机免费的ai下载

33字幕图手

ProductPics.AiAI智能app下载最新版本

Produc

302.AI智能助手app下载

302.AI

MoneyPrinterai人工智能免费软件下载

MoneyP

MediaGo人工智能ai下载

MediaG

FireShot智能AI助手app推荐

FireSh

ArtHub.AI下载安装app

ArtHub

Resonaai人工智能软件

Resona

最新文章

沁言学术AI的产品功能

沁言学术AI

沁言AI如何处理以及有什么优势？

沁言AI如何

OpenWork-开源AI桌面工作流平台，Claude Cowork平替

OpenWo

Prompt Manager-开源AI提示词管理工具，智能分类

Prompt

FrogBoss-微软开源的系列编程模型

FrogBo

NovaSR-开源音频超分模型，能将低音质转换为高音质音频

NovaSR

Playwriter-开源AI浏览器自动化工具，人机协作无缝切换

Playwr

VerseCrafter-复旦联合腾讯开源的动态真实视频世界模型

VerseC

PersonaPlex-英伟达推出的全双工语音对语音AI模型

Person

GLM-4.7-Flash-智谱开源的混合思考模型

GLM-4.

COTA-超参数科技推出的新型游戏智能体

COTA-超

x-Algorithm-马斯克开源的x平台推荐算法

x-Algo

俄罗斯9层楼高暴雪视频引争议当地留学生：是AI合成的假雪

俄罗斯9层楼

Step3-VL-10B-阶跃星辰开源的多模态小模型

Step3-

微软AI负责人预言：未来五年内人人都将有AI伴侣

微软AI负责

EmbodiChain-跨维智能开源的具身智能学习平台

Embodi

NVIDIA黄仁勋：未来的电脑比现在强10亿倍

NVIDIA

json-render-Vercel开源的AI生成UI渲染可控方案

json-r