Kaleido-智谱AI开源的多主体视频生成框架

Kaleido-智谱AI开源的多主体视频生成框架

文章来源:智汇AI    发布时间:2025-12-13

Kaleido 是智谱AI开源的多主体视频生成框架,能解决多主体视频生成中的主体一致性与背景解耦问题。框架通过创新的数据构建管线和 R-RoPE(Referen

暂无访问

Kaleido是什么

Kaleido 是智谱AI开源的多主体视频生成框架,能解决多主体视频生成中的主体一致性与背景解耦问题。框架通过创新的数据构建管线和 R-RoPE(Reference Rotary Positional Encoding)机制,有效分离主体与背景信息,在多主体场景下保持主体特征一致性。Kaleido 在多主体视频生成中达到 SOTA 效果,为视频生成领域提供强大的开源方案,助力开发者实现高质量的多主体视频创作。

Kaleido

Kaleido的主要功能

多主体一致性生成:框架能在视频中保持多个主体(如人物、物体等)的视觉一致性,在复杂场景和多人交互中能维持稳定的主体特征。

相关推荐