字节跳动发布图像编辑模型SeedEdit3.0,处理更加丝滑高效

字节跳动发布图像编辑模型SeedEdit3.0,处理更加丝滑高效

文章来源:智汇AI    发布时间:2025-06-12

它能够处理并生成 4K 图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。

暂无访问

智汇AI6月6日消息,字节跳动Seed团队今日宣布发布图像编辑模型SeedEdit3.0,目前已经在即梦网页端开启测试,豆包App也即将上线。

依靠AI完成指令式图像编辑的需求,广泛存在于视觉内容创意工作中。但此前,图像编辑模型在主体&背景保持、指令遵循等方面能力相对有限,导致编辑图像可用率不高。

据字节跳动官方介绍,SeedEdit3.0基于文生图模型Seedream3.0,叠加多样化的数据融合方法与特定奖励模型,较好地解决了上述难题。其图像主体、背景和细节保持能力进一步提升,尤其在人像编辑、背景更改、视角与光线转换等场景表现较为突出。

该模型可处理并生成4K图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。尤其针对图像编辑“哪里改与哪里不改”的取舍,该模型表现出更佳的理解力和权衡力,可用率相应提高。当用户需要去掉图片内一众行人,模型不仅可以准确识别并移除场景内的无关人物,连影子也能一并去掉。

▲Prompt:移除中间人物以外的所有行人

在2D绘画转为真实模特的任务中,SeedEdit3.0较好地保持了人物的衣帽穿搭与手提包等细节,生成图片兼具时尚街拍感。

Prompt:使女孩看起来逼真

整个场景的光影变换,模型也可以处理得丝滑、自然。从近处房屋,到远处海水波纹,细节均能合理保留下来,并跟随光线变化,进行“像素级”的渲染调整。

Prompt:把场景变为白天

为了实现上述能力,团队在SeedEdit3.0的研发工作中提出了一种高效的数据融合策略,并构建了多种专用奖励模型。

通过将这些奖励模型与扩散模型联合训练,团队针对性地改善了关键任务的编辑质量(如人脸对齐、文本渲染等)。实际落地中,我们也对推理加速进行了同步优化。

Prompt:将“STOP”更改为“WARM”

字节跳动表示,除进一步优化编辑性能外,未来团队还将探索更丰富的编辑操作,让模型拥有连续多图生成、多张图像合成、故事性内容生成等能力。

智汇AI附链接如下:

项目主页:https://seed.bytedance.com/seededit

技术报告:https://arxiv.org/pdf/2506.05083

相关推荐