文章来源:智汇AI 发布时间:2025-12-13
SSVAE(Spectral-Structured VAE)是智谱AI推出的优化视频生成的新型变分自编码器。SSVAE通过谱分析发现,视频 VAE 的隐空间若具
暂无访问SSVAE(Spectral-Structured VAE)是智谱AI推出的优化视频生成的新型变分自编码器。SSVAE通过谱分析发现,视频 VAE 的隐空间若具备时空低频偏置和通道特征值的少模式偏置,能显著加速下游扩散模型的训练。SSVAE 提出局部相关性正则化(LCR)和隐空间掩码重建(LMR)两种轻量级正则化方法,分别用于增强低频能量和促进少模式偏置。实验表明,SSVAE 在相同生成质量下,收敛速度提升3倍,仅用1.3B参数量就超越了4B参数的传统模型,显著提高视频生成效率。