UnityVideo-快手可灵联合港科大开源的视频生成框架

UnityVideo-快手可灵联合港科大开源的视频生成框架

文章来源:智汇AI    发布时间:2025-12-16

UnityVideo 是香港科技大学联合快手可灵团队、清华大学等推出的新型多模态、多任务视频生成框架,能通过整合多种视觉模态(如分割、骨架、深度、光流等)和训练

暂无访问

UnityVideo是什么

UnityVideo 是香港科技大学联合快手可灵团队、清华大学等推出的新型多模态、多任务视频生成框架,能通过整合多种视觉模态(如分割、骨架、深度、光流等)和训练范式,提升视频生成模型对物理世界的理解能力。框架通过动态噪声注入和模态自适应学习机制,实现 RGB 视频与辅助模态之间的双向学习,加速模型收敛,显著增强零样本泛化能力。

UnityVideo

UnityVideo的主要功能

多模态视频生成:框架能从文本描述生成高质量的 RGB 视频,结合多种辅助模态(如深度图、光流、分割掩码、人体骨架、DensePose 等)进行联合生成,提升视频的物理真实性和一致性。

相关推荐