谷歌推出Imagen4/Ultra系列AI文生图模型,每张图片0.04美元起

谷歌推出Imagen4/Ultra系列AI文生图模型,每张图片0.04美元起

文章来源:智汇AI    发布时间:2025-06-28

谷歌发布最新文本生成图像模型Imagen 4系列,包含标准版和高端Ultra版,定价分别为0.04美元和0.06美元每张。谷歌称其效果优于Dall-E和Midjourney,但实际表现仍显机械化。目前已在Gemini API付费预览版上线。

暂无访问

智汇AI6月26日消息,谷歌推出了其最新版本的文本生成图像模型Imagen4,并推出了高端版本Imagen4Ultra。与前代产品Imagen3相比,此次更新旨在显著提升文本渲染效果。目前,这两个版本已上线GeminiAPI的付费预览版,并在GoogleAIStudio提供有限的免费测试。

谷歌将Imagen4定位为“适用于大多数任务”的通用模型,每张图像为定价0.04美元(智汇AI注:现汇率约合0.29元人民币)。而Imagen4Ultra则被设计为能够更精准地遵循文本提示词的高端版本,其价格较普通版高出50%,每张图像收费0.06美元(现汇率约合0.43元人民币)。谷歌声称,与Dall-E和Midjourney等其他图像生成器相比,Imagen4Ultra的输出结果更为“出色(strong)”。

在展示环节中,谷歌展示了Imagen4Ultra生成的一系列图像,包括一幅三格漫画,内容是一艘小型宇宙飞船被一只巨大的蓝色太空蜥蜴攻击,漫画中还配有“嘎吱”等音效,甚至出现了令人费解的“哈迪”字样。该图像完全按照文本提示词生成,效果尚可,类似于3D应用程序中的卡通渲染效果。

Imagen4Ultra

另一个文本提示词是“京都复古旅行明信片的正面:樱花树下的标志性宝塔,远处的雪山,晴朗的蓝天,鲜艳的色彩”。Imagen4Ultra按照提示生成了图像,虽然风格较为普通,但细节上基本符合要求。此外,还有展示登山情侣在岩石上挥手的图像,以及一幅“前卫”风格的时尚摄影图像。这些图像质量确实不错,也精准地符合了文本提示词,但整体仍然显得高度机械化。

尽管Imagen4在性能上较前代有所提升,但其表现并未让人眼前一亮,尤其是在与市场领导者Dall-E3和Midjourney7相比时。此外,在最初的热情过后,公众对AI艺术的兴趣似乎正在消退,其主要应用场景似乎变成了社交媒体上的垃圾广告。

相关推荐