文章来源:智汇AI 发布时间:2025-08-27
Nano-Banana火了,冒出一堆假网站,李鬼和李逵傻傻分不清。
暂无访问神秘AI模型Nano-Banana火了,冒出一堆假网站,李鬼和李逵傻傻分不清。
最近,AI社区又冒出一个神秘的图像生成和编辑模型,名叫Nano-Banana。
起初它在LMArena平台的「Battle」模式中被发现,但未在公开排行榜上列出,也没有官方开发者明确声称其归属。
不过很多网友循着蛛丝马迹,猜测这可能是谷歌的研究模型。
上周二,谷歌AIStudio产品负责人LoganKilpatrick在X上发布了一个香蕉表情符号。
谷歌DeepMind产品经理NainaRaisinghani也发布了一张与意大利艺术家MaurizioCattelan2019年创作的胶带粘贴香蕉艺术作品类似的图片。
再加上谷歌过去曾将其较小的模型称为「Nano」,而且其生成图像的质感与Google的Imagen或Gemini系列相似。
以上种种,似乎都在暗示它出自谷歌之手。
该模型不仅在文本编辑、风格融合和场景理解等方面表现更优,还可以上传两张图片、输入提示词将其中的元素融合。
比如,上传一摞书和卧室床头柜的图片,输入提示词「Flipstackofbookstobeuprightandputontablebetweentwobookends.」
它能精准理解复杂文本提示,将横放的三本书立起来,并加上书挡摆放到柜子上。
上传一张模特照再加上一张棒球帽子图,输入提示词:「Putthebaseballhatonthewoman.」
棒球帽上有着复杂的文字和图案刺绣,Nano-Banana编辑后的图片保留了帽子上的所有细节,同时光线、视角和构图也能一致性。
在产品照片、场景搭建图、广告等商业场景下,Nano-Banana的表现也稳得一批。
当然,它也并非完美无缺,在某些情况下,Nano-Banana生成的图像可能出现反射、光照逻辑或物体位置不一致等视觉问题,人物的手指也偶尔出现畸形的情况。
如果细看上图中生成的书籍,就会发现其中的瑕疵:书名出现了「鬼画符」。
由于尚无官方API或正式的官网链接,我们只能通过LMArena随机体验该模型。
换句话说,每次都得靠运气才能遇到NanoBanana,体验很不稳定。
更搞笑的是,网上出现了一堆假网站,声称提供NanoBanana服务,让不少网友李鬼和李逵傻傻分不清。
我们也来了个一手测评。
打开lmarena官网,选择Battle模式,可以直接输入提示词进行文生图,也可以上传图片、输入提示词再进行AI编辑。
官网链接:https://lmarena.ai/
页面会出现两个匿名模型同时生成图片,只有当我们选出其中生成质量最好的一张图片时,平台才会亮出对战双方的身份。
先来试试文生图效果。
我们输入同样的提示词:Presentaportrait-styleimageinaPolaroidphotoshootstyle.Inthepicture,thereisamakeupartistwithlong,loosecurlyhair,wearingoversizedclothing.Shehasadelicatefaceandexudesacasualvibe,posingwithapeacesigndirectlyatthecamera,creatinganultra-freeatmosphere.Theimagehasaslightgrainytexture,withvibrantandcaptivatingcolors,1:1.
第一幅是NanoBanana的「作品」,第二幅是ChatGPT生成的效果。前者生成的图片背景中有杂乱的眼影盘、指甲油等,更符合提示词中的「化妆师」身份,而且人物的动作、服装细节更自然,手部也没有明显的瑕疵;而后者背景较为单一,大拇指也有些虚化。
再来试试它的图片编辑功能。
上传一张旧金山阿拉莫广场的野餐照片,输入提示词:Addsomehumanoidrobotsinthepark,makethemblendwiththeenvironment.
乍一看我们还以为NanoBanana「罢工」了,直到在画面右侧找到了一个正在走路的类人机器人,它完全融入环境,毫无违和感。
我们上传一张人物摄影照片,让NanoBanana进行逆向工程描绘其创作过程。
提示词:Showthesetbeingsetupbefore,themodelissittingupscrollingherphone,thereisawomanbehindthemodelfixingherhair,amanuponaladder,hangingthecurtaininthebackground,revealingthestudiobehindit.
有网友用NanoBanana让碧梨和迈克尔・杰克逊跨时空自拍:
我们也尝试了下。上传马斯克和奥特曼的照片,输入提示词:Thetwopeoplearehappilytakingaselfie.
NanoBanana确实生成了一张自拍照,马斯克的形象、动作也几乎找不出什么问题,只是奥特曼大变样。
为了不「冤枉」它,我们又给了它一次机会,NanoBanana还是翻车。
难度继续升级。上传小扎、马斯克肖像照和一张风景照,让NanoBanana把两个人自然地放在图三中。
Gemini2.0flash生成的效果完全认不出这两个大名人,而NanoBanana将二人完美融入图三环境中,不过手指等细节方面还是有瑕疵。
如果把Nano-Banana和谷歌的Veo3结合在一起,会碰撞出怎样的火花?
@a16z合伙人JustineMoore就搞了个新工作流,用于制作较长的视频。
下面这个视频是一个游戏或电影中的潜行任务场景,角色从昏暗的博物馆中盗取一幅名画,触发了激光警报。
她还放出了制作教程。提取第一个视频片段的最后一帧,将该帧上传到lmarena上的NanoBanana,提示生成下一个场景,例如「角色转向走廊」,然后将新生成的帧用Veo3进行动画制作。
X网友@ZHO_ZHO_ZHO则发现了Nano-Banana另一种好玩的用法——把插画变成手办。
上传一张图片,输入提示词:turnthisphotointoacharacterfigure.Behindit,placeaboxwiththecharacter’simageprintedonit,andacomputershowingtheBlendermodelingprocessonitsscreen.Infrontofthebox,addaroundplasticbasewiththecharacterfigurestandingonit.MakethePVCmateriallookclear,andsetthesceneindoorsifpossible.
据该博主测评,Nano-Banana生成的图几乎没有AI味,五官和细节都保留得很好,真实感十足。
然后再用Veo3将其制作为8秒视频。提示词:Pickupthefigurewithbothhandsandshowitfromallangles.
底下评论区不少网友也按照上述工作流整活。比如哪吒双手抱拳的:
还有哆啦A梦的,正面看哆啦A梦的尾巴挺正常,但转个身就大变样:
我们也复刻了下,上传一张Q版插画图片,输入以上提示词。
效果如下:
最后打开Gemini2.5Pro,选择Video,上传生成的图片,输入提示词,静待1分钟左右,就能得到一段8秒视频。
上周末,谷歌Veo3对所有Gemini用户免费开放,供其体验AI视频生成功能。
不过,这项免费体验活动只持续到太平洋时间8月24日晚上10点(北京时间8月25日上午1点)。在此期间,免费用户每天最多可以生成3个8秒的视频片段,每个视频都包含自动生成的音频。
通常,Veo3的视频生成功能仅对GoogleAIPro或Ultra订阅用户开放。Pro用户每天可生成3个视频,而Ultra用户的配额为10个视频。
感兴趣的朋友也去体验一波吧。
https://x.com/ginacostag_/status/1959234207127134340
https://x.com/venturetwins/status/1957155767888548160
https://x.com/techhalla/status/1959186906115354692
https://x.com/ZHO_ZHO_ZHO/status/1958550998815023573
本文来自微信公众号“机器之心”(ID:almosthuman2014),编辑:杨文,经授权发布。