Stability AI开源新一代文生图模型Stable Diffusion 3.5
近日,知名开源图像生成器Stable Diffusion开发商Stability AI宣布推出全新的V3.5版本。
Stable Diffusion 3.5一共有Large、Large Turbo和Medium三个版本,可根据不同的商业环境提供高度定制功能,同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。
Stable Diffusion 3.5提供了多个版本的图像大模型,以满足不同用户群体的需求。
- Stable Diffusion 3.5 Large模型拥有80亿参数,提供了卓越的图片质量和高度文本语义还原,是Stable Diffusion家族中最强大的模型,非常适合专业使用,尤其是在100万像素分辨率的图片。
- Stable Diffusion 3.5 Large Turbo模型则是一个蒸馏版本,它能够在仅仅4步之内生成高质量的图像,并且对提示的遵循性非常好,速度比Stable Diffusion 3.5 Large快得多。
- Stable Diffusion 3.5 Medium模型将在10月29日发布,这个模型有25亿参数,采用了改进的MMDiT-X架构和训练方法,能在消费级硬件上即开即用,可生成0.25—200万像素之间生成图像,兼顾了质量和易定制性。
今年6月,Stability AI首次开源了第三代文生图模型Stable Diffusion 3 Medium,但在用户群里反馈效果未达到预期,在听取了社区反馈后,Stability AI花费大量时间进一步开发,便有了近期推出的V3.5版本。