StoryMem-字节联合南洋理工推出的视频生成框架

StoryMem-字节联合南洋理工推出的视频生成框架

文章来源:智汇AI    发布时间:2026-01-07

StoryMem 是字节跳动与南洋理工大学联合发布的开源视频生成框架,解决 AI 视频生成中长期存在的跨镜头一致性问题。通过显式视觉记忆机制,将单镜头视频扩散模

暂无访问

StoryMem是什么

StoryMem 是字节跳动与南洋理工大学联合发布的开源视频生成框架,解决 AI 视频生成中长期存在的跨镜头一致性问题。通过显式视觉记忆机制,将单镜头视频扩散模型转化为多镜头叙事工具。核心是 Memory-to-Video(M2V)模块,通过维护动态更新的关键帧记忆库,将记忆注入到单镜头模型中,确保跨镜头一致性。

StoryMem

StoryMem的主要功能

多镜头长视频生成:能生成连贯的多镜头长视频故事,支持跨多个场景的叙事,保持角色和场景元素的一致性。

相关推荐