文章来源:智汇AI 发布时间:2025-08-06
BrushNet是由腾讯PCG部门的ARC实验室与香港大学的研究人员推出的一个基于扩散模型的即插即用的图像照片修复(Inpainting)模型,通过分解的双分支
暂无访问BrushNet是由腾讯PCG部门的ARC实验室与香港大学的研究人员推出的一个基于扩散模型的即插即用的图像照片修复(Inpainting)模型,通过分解的双分支架构来有效处理图像中的遮罩区域。该模型的一个分支专注于提取遮罩图像的像素级特征,而另一个分支则负责图像的生成。这种设计使得BrushNet能够将关键的遮罩信息以分层的方式精细地融入到修复过程中,从而在保持原有图像内容连贯性的同时,生成高质量的修复结果。
与以前的图像修复方法相比(如Blended Latent Diffusion、Stable Diffusion Inpainting、HD-Painter、PowerPaint等),BrushNet的图像还原修复能力无论是在风格、内容,还是颜色和提示对齐等方面都表现出了优越的连贯性。
BrushNet 基于扩散模型通过一个创新的双分支架构来执行图像修复任务。
以下是BrushNet工作原理的简要概述:
双分支架构:BrushNet的核心是一个分解的双分支架构,其中一个分支专注于处理遮罩图像的特征,而另一个分支负责生成图像的其余部分。遮罩图像特征提取:在遮罩分支中,模型使用变分自编码器(VAE)对遮罩图像进行编码,以提取其潜在特征。这些特征随后被用来指导图像的修复过程。预训练扩散模型:在生成分支中,模型利用预训练的扩散模型来生成图像内容。这个模型已经学会了如何从噪声中恢复出清晰的图像。特征融合:提取的遮罩图像特征被逐步融合到预训练的扩散模型中,这样可以通过层级的方式细致地控制修复过程。去噪和生成:在反向扩散过程中,模型通过迭代去噪步骤,逐步从噪声中恢复出清晰的图像。每一步都会考虑遮罩图像的特征,以确保修复区域与原始图像的其余部分在视觉上保持一致。模糊融合策略:为了更好地保留未遮罩区域的细节,BrushNet采用了模糊融合策略。这意味着在融合遮罩区域和生成区域时,会使用模糊的遮罩来减少硬边缘和不自然的过渡。输出修复图像:最终,模型输出一个修复后的图像,其中遮罩区域被自然而连贯地填充,同时未遮罩区域的原始内容得到保留。