Stability AI开源新一代文生图模型Stable Diffusion 3.5

AI快讯 2024-10-29 15:27更新

近日，知名开源图像生成器Stable Diffusion开发商Stability AI宣布推出全新的V3.5版本。

Stable Diffusion 3.5一共有Large、Large Turbo和Medium三个版本，可根据不同的商业环境提供高度定制功能，同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。

Stable Diffusion 3.5提供了多个版本的图像大模型，以满足不同用户群体的需求。

Stable Diffusion 3.5 Large模型拥有80亿参数，提供了卓越的图片质量和高度文本语义还原，是Stable Diffusion家族中最强大的模型，非常适合专业使用，尤其是在100万像素分辨率的图片。
Stable Diffusion 3.5 Large Turbo模型则是一个蒸馏版本，它能够在仅仅4步之内生成高质量的图像，并且对提示的遵循性非常好，速度比Stable Diffusion 3.5 Large快得多。
Stable Diffusion 3.5 Medium模型将在10月29日发布，这个模型有25亿参数，采用了改进的MMDiT-X架构和训练方法，能在消费级硬件上即开即用，可生成0.25—200万像素之间生成图像，兼顾了质量和易定制性。

今年6月，Stability AI首次开源了第三代文生图模型Stable Diffusion 3 Medium，但在用户群里反馈效果未达到预期，在听取了社区反馈后，Stability AI花费大量时间进一步开发，便有了近期推出的V3.5版本。

CADCrafter-单张图片到参数化CAD模型生成框架