谷歌Gemini2.5Flash升级AI修图功能，多项表现优于GPT-4o

谷歌Gemini2.5Flash升级AI修图功能，多项表现优于GPT-4o

文章来源：智汇AI 发布时间：2025-08-27

科技媒体TheDecoder昨日（8月26日）发布博文，报道称谷歌DeepMind推出全新Gemini25Flash图像编辑模型，在Gemini应用中可根据文字指令，在保

暂无访问

8月27日消息，科技媒体TheDecoder昨日（8月26日）发布博文，报道称谷歌DeepMind推出全新Gemini2.5Flash图像编辑模型，在Gemini应用中可根据文字指令，在保持人物与动物的外观一致的情况下，提高修改图片的精度。

援引博文介绍，与此前的原生图像生成工具相比，它在根据文字进行图像修改时的准确率更高，甚至在多项任务中优于ChatGPT所用的GPT-4o，让其能更好地基于复杂文字编辑图像。

新模型的亮点是“角色一致性”功能。在生成多张图像后，即便人物姿势、背景或光线发生变化，也能保持同一人、动物或物体的外观一致。这对于创建系列照片、产品多角度展示尤其有价值，适合品牌素材与产品目录的批量制作。

Gemini2.5Flash支持精准的局部文字编辑，用户无需手动圈选即可完成背景虚化、去除瑕疵、添加颜色或移除物体等操作。

该模型能一次融合最多三张图像，例如将产品照与室内照片结合成逼真的场景。它还支持“风格迁移”，将一种纹理、颜色或图案应用到另一物体上，同时保持形状与细节完整。基于“现实推理”的功能更可模拟简单因果，如生成气球飞向仙人掌及随后的结果画面。

Gemini2.5Flash已在Gemini应用中上线，用户需将模型切换至“Flash”才能使用图像编辑功能，生成的图像附有可见水印及不可见的SynthID数字水印。

开发者可通过GeminiAPI、GoogleAIStudio与VertexAI试用，费用为每百万输出token30美元，单张图像成本约0.039美元。

相关推荐

最新收录

沁言AI可以解决什么问题？

沁言AI可以

沁言学术

沁言学术

SVGWave手机版ai工具

SVGWav

ProductScopeAi智能助手下载安装

Produc

Go-with-the-Flow人工智能平台官网

Go-wit

51数字人ai工具免费版下载

51数字人a

CoolBackgroundsai人工智能免费下载

CoolBa

Atoms.Dev智能工具APP最新版下载

Atoms.

SketchGPTAi手机

Sketch

imgAK

imgAK

33字幕图手机免费的ai下载

33字幕图手

ProductPics.AiAI智能app下载最新版本

Produc

302.AI智能助手app下载

302.AI

MoneyPrinterai人工智能免费软件下载

MoneyP

MediaGo人工智能ai下载

MediaG

FireShot智能AI助手app推荐

FireSh

ArtHub.AI下载安装app

ArtHub

Resonaai人工智能软件

Resona

最新文章

沁言学术AI的产品功能

沁言学术AI

沁言AI如何处理以及有什么优势？

沁言AI如何

OpenWork-开源AI桌面工作流平台，Claude Cowork平替

OpenWo

Prompt Manager-开源AI提示词管理工具，智能分类

Prompt

FrogBoss-微软开源的系列编程模型

FrogBo

NovaSR-开源音频超分模型，能将低音质转换为高音质音频

NovaSR

Playwriter-开源AI浏览器自动化工具，人机协作无缝切换

Playwr

VerseCrafter-复旦联合腾讯开源的动态真实视频世界模型

VerseC

PersonaPlex-英伟达推出的全双工语音对语音AI模型

Person

GLM-4.7-Flash-智谱开源的混合思考模型

GLM-4.

COTA-超参数科技推出的新型游戏智能体

COTA-超

x-Algorithm-马斯克开源的x平台推荐算法

x-Algo

俄罗斯9层楼高暴雪视频引争议当地留学生：是AI合成的假雪

俄罗斯9层楼

Step3-VL-10B-阶跃星辰开源的多模态小模型

Step3-

微软AI负责人预言：未来五年内人人都将有AI伴侣

微软AI负责

EmbodiChain-跨维智能开源的具身智能学习平台

Embodi

NVIDIA黄仁勋：未来的电脑比现在强10亿倍

NVIDIA

json-render-Vercel开源的AI生成UI渲染可控方案

json-r