谷歌偷偷搞了个神秘模型Nano-Banana？实测：强到离谱，但有3大硬伤

文章来源：智汇AI 发布时间：2025-08-27

Nano-Banana火了，冒出一堆假网站，李鬼和李逵傻傻分不清。

暂无访问

神秘AI模型Nano-Banana火了，冒出一堆假网站，李鬼和李逵傻傻分不清。

最近，AI社区又冒出一个神秘的图像生成和编辑模型，名叫Nano-Banana。

起初它在LMArena平台的「Battle」模式中被发现，但未在公开排行榜上列出，也没有官方开发者明确声称其归属。

不过很多网友循着蛛丝马迹，猜测这可能是谷歌的研究模型。

上周二，谷歌AIStudio产品负责人LoganKilpatrick在X上发布了一个香蕉表情符号。

谷歌DeepMind产品经理NainaRaisinghani也发布了一张与意大利艺术家MaurizioCattelan2019年创作的胶带粘贴香蕉艺术作品类似的图片。

再加上谷歌过去曾将其较小的模型称为「Nano」，而且其生成图像的质感与Google的Imagen或Gemini系列相似。

以上种种，似乎都在暗示它出自谷歌之手。

该模型不仅在文本编辑、风格融合和场景理解等方面表现更优，还可以上传两张图片、输入提示词将其中的元素融合。

比如，上传一摞书和卧室床头柜的图片，输入提示词「Flipstackofbookstobeuprightandputontablebetweentwobookends.」

它能精准理解复杂文本提示，将横放的三本书立起来，并加上书挡摆放到柜子上。

上传一张模特照再加上一张棒球帽子图，输入提示词：「Putthebaseballhatonthewoman.」

棒球帽上有着复杂的文字和图案刺绣，Nano-Banana编辑后的图片保留了帽子上的所有细节，同时光线、视角和构图也能一致性。

在产品照片、场景搭建图、广告等商业场景下，Nano-Banana的表现也稳得一批。

当然，它也并非完美无缺，在某些情况下，Nano-Banana生成的图像可能出现反射、光照逻辑或物体位置不一致等视觉问题，人物的手指也偶尔出现畸形的情况。

如果细看上图中生成的书籍，就会发现其中的瑕疵：书名出现了「鬼画符」。

由于尚无官方API或正式的官网链接，我们只能通过LMArena随机体验该模型。

换句话说，每次都得靠运气才能遇到NanoBanana，体验很不稳定。

更搞笑的是，网上出现了一堆假网站，声称提供NanoBanana服务，让不少网友李鬼和李逵傻傻分不清。

Nano-Banana一手测评

我们也来了个一手测评。

打开lmarena官网，选择Battle模式，可以直接输入提示词进行文生图，也可以上传图片、输入提示词再进行AI编辑。

官网链接：https://lmarena.ai/

页面会出现两个匿名模型同时生成图片，只有当我们选出其中生成质量最好的一张图片时，平台才会亮出对战双方的身份。

先来试试文生图效果。

我们输入同样的提示词：Presentaportrait-styleimageinaPolaroidphotoshootstyle.Inthepicture,thereisamakeupartistwithlong,loosecurlyhair,wearingoversizedclothing.Shehasadelicatefaceandexudesacasualvibe,posingwithapeacesigndirectlyatthecamera,creatinganultra-freeatmosphere.Theimagehasaslightgrainytexture,withvibrantandcaptivatingcolors，1:1.

第一幅是NanoBanana的「作品」，第二幅是ChatGPT生成的效果。前者生成的图片背景中有杂乱的眼影盘、指甲油等，更符合提示词中的「化妆师」身份，而且人物的动作、服装细节更自然，手部也没有明显的瑕疵；而后者背景较为单一，大拇指也有些虚化。

再来试试它的图片编辑功能。

上传一张旧金山阿拉莫广场的野餐照片，输入提示词：Addsomehumanoidrobotsinthepark，makethemblendwiththeenvironment.

乍一看我们还以为NanoBanana「罢工」了，直到在画面右侧找到了一个正在走路的类人机器人，它完全融入环境，毫无违和感。

我们上传一张人物摄影照片，让NanoBanana进行逆向工程描绘其创作过程。

提示词：Showthesetbeingsetupbefore,themodelissittingupscrollingherphone,thereisawomanbehindthemodelfixingherhair,amanuponaladder,hangingthecurtaininthebackground,revealingthestudiobehindit.

有网友用NanoBanana让碧梨和迈克尔・杰克逊跨时空自拍：

我们也尝试了下。上传马斯克和奥特曼的照片，输入提示词：Thetwopeoplearehappilytakingaselfie.

NanoBanana确实生成了一张自拍照，马斯克的形象、动作也几乎找不出什么问题，只是奥特曼大变样。

为了不「冤枉」它，我们又给了它一次机会，NanoBanana还是翻车。

难度继续升级。上传小扎、马斯克肖像照和一张风景照，让NanoBanana把两个人自然地放在图三中。

Gemini2.0flash生成的效果完全认不出这两个大名人，而NanoBanana将二人完美融入图三环境中，不过手指等细节方面还是有瑕疵。

进阶玩法

如果把Nano-Banana和谷歌的Veo3结合在一起，会碰撞出怎样的火花？

@a16z合伙人JustineMoore就搞了个新工作流，用于制作较长的视频。

下面这个视频是一个游戏或电影中的潜行任务场景，角色从昏暗的博物馆中盗取一幅名画，触发了激光警报。

她还放出了制作教程。提取第一个视频片段的最后一帧，将该帧上传到lmarena上的NanoBanana，提示生成下一个场景，例如「角色转向走廊」，然后将新生成的帧用Veo3进行动画制作。

X网友@ZHO_ZHO_ZHO则发现了Nano-Banana另一种好玩的用法——把插画变成手办。

上传一张图片，输入提示词：turnthisphotointoacharacterfigure.Behindit,placeaboxwiththecharacter’simageprintedonit,andacomputershowingtheBlendermodelingprocessonitsscreen.Infrontofthebox,addaroundplasticbasewiththecharacterfigurestandingonit.MakethePVCmateriallookclear,andsetthesceneindoorsifpossible.

据该博主测评，Nano-Banana生成的图几乎没有AI味，五官和细节都保留得很好，真实感十足。

然后再用Veo3将其制作为8秒视频。提示词：Pickupthefigurewithbothhandsandshowitfromallangles.

底下评论区不少网友也按照上述工作流整活。比如哪吒双手抱拳的：

还有哆啦A梦的，正面看哆啦A梦的尾巴挺正常，但转个身就大变样：

我们也复刻了下，上传一张Q版插画图片，输入以上提示词。

效果如下：

最后打开Gemini2.5Pro，选择Video，上传生成的图片，输入提示词，静待1分钟左右，就能得到一段8秒视频。

上周末，谷歌Veo3对所有Gemini用户免费开放，供其体验AI视频生成功能。

不过，这项免费体验活动只持续到太平洋时间8月24日晚上10点（北京时间8月25日上午1点）。在此期间，免费用户每天最多可以生成3个8秒的视频片段，每个视频都包含自动生成的音频。

通常，Veo3的视频生成功能仅对GoogleAIPro或Ultra订阅用户开放。Pro用户每天可生成3个视频，而Ultra用户的配额为10个视频。

感兴趣的朋友也去体验一波吧。

https://x.com/ginacostag_/status/1959234207127134340