Next-Frame Diffusion-北大联合微软推出的自回归视频生成模型

Next-Frame Diffusion-北大联合微软推出的自回归视频生成模型

文章来源:智汇AI    发布时间:2025-08-08

Next-Frame Diffusion(NFD)是北京大学和微软研究院联合推出的自回归视频生成模型,结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。

暂无访问

Next-Frame Diffusion是什么

Next-Frame Diffusion(NFD)是北京大学和微软研究院联合推出的自回归视频生成模型,结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。Next-Frame Diffusion基于块因果注意力机制(Block-wise Causal Attention)和扩散变换器(Diffusion Transformer)实现高效的帧级生成。模型在保持视频质量和连贯性的同时,实现超过30FPS的实时视频生成。模型引入、一致性蒸馏(Consistency Distillation)和推测性采样(Speculative Sampling)等技术,进一步提升采样效率。模型在大规模动作条件视频生成任务中表现出色,显著优于现有方法。

Next-Frame Diffusion

相关推荐