文章来源:智汇AI 发布时间:2025-08-07
I2VGen-XL 是阿里巴巴达摩院推出的一款开源的图像到视频的生成模型,通过创新的级联扩散方法,将文本视频数据与视频结构解耦,同时利用静态图像作为关键指导形式
暂无访问I2VGen-XL 是阿里巴巴达摩院推出的一款开源的图像到视频的生成模型,通过创新的级联扩散方法,将文本视频数据与视频结构解耦,同时利用静态图像作为关键指导形式,确保了输入数据的对齐性,将静态图像合成为高质量的动态视频。这种方法有效解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。
I2VGen-XL的项目主页为:https://i2vgen-xl.github.io/,GitHub代码库为:https://github.com/ali-vilab/i2vgen-xl,研究论文地址为:https://arxiv.org/abs/2311.04145,普通用户可以通过Hugging Face或ModelScope魔搭社区的Demo进行在线体验:
访问I2VGen-XL的Demo主页(Hugging Face版:https://huggingface.co/spaces/modelscope/I2VGen-XL;ModelScope版:https://www.modelscope.cn/studios/damo/I2VGen-XL-Demo/summary)选择合适的图片进行上传(建议图片比例为1:1),然后点击「生成视频」待初步生成的视频完成后,进入下一步添加对视频内容的英文文本描述点击「生成高分辨率视频」,等待2分钟左右,视频便能生成好了