Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频

AI快讯 2025-04-03 14:51更新

Stable Virtual Camera是什么？

Stable Virtual Camera 是由 Stability AI 推出的一款用于NVS 的多视角扩散模型。它能够根据任意数量的输入视角及其对应的相机参数，生成目标相机视角下的新图像。当所有相机形成一条轨迹时，生成的视角在 3D 上具有一致性、时间上平滑，并且正如其名称所暗示的那样——“稳定”，能够生成无缝的轨迹视频。

Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频.webp

Stable Virtual Camera功能

多视角输入：可以接受从 1 到 32 张输入图像，性能随着输入视角的增加而提升，尤其是在处理大型场景时。

灵活的图像分辨率：尽管模型仅在 576×576 的正方形图像上进行训练，但能够以零样本的方式生成不同宽高比的目标视角。

长视频生成与闭环一致性：能够生成长达 1000 帧的视频，并在相机返回到同一位置时保持 3D 一致性。

采样多样性：在给定稀疏输入视角时，能够捕捉视角合成的不确定性，并生成不同的可能场景。

基准测试：建立了一个全面的基准，用于在不同数据集和设置下评估 NVS 方法。Stable Virtual Camera 达到了新的最佳性能。

Stable Virtual Camera应用

广告和营销：快速生成吸引人的产品展示视频。

内容创作：帮助艺术家和设计师将静态图像转化为动态视频。

教育和培训：将教材中的静态插图转化为 3D 视频，增强学习体验。

数字电影和 3D 动画：为影视制作提供新的可能性。

Stable Virtual Camera使用方法

1. 获取代码和模型

代码：从 GitHub 克隆代码。链接见文章末尾。

模型权重：从 Hugging Face 下载模型文件。下载链接见文章末尾。

2. 安装依赖

运行以下命令安装所需依赖：

pipinstall-rrequirements.txt

3. 运行方式

交互式使用（Gradio 演示）

启动 Gradio 演示：

pythongradio_demo.py

通过图形界面上传图片并设置参数，生成 3D 视频。

命令行使用（CLI）

使用命令行运行：

pythondemo.py--data_path--output_path--camera_path

示例：

pythondemo.py--data_path./input_images--output_path./output_video--camera_pathspiral

4. 输入和输出

输入：支持 1 到 32 张 2D 图像，需提供相机参数。

输出：生成不同宽高比（如 1:1、9:16、16:9）的 3D 视频，支持长达 1000 帧。

GitHub 代码仓库：https://github.com/Stability-ai/stable-virtual-camera

Hugging Face 模型页面：https://huggingface.co/stabilityai/stable-virtual-camera

项目主页：https://stable-virtual-camera.github.io/

论文：https://arxiv.org/abs/2503.14489

Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频

网络

2025-04-03

SmolDocling：将复杂的文档转换为结构化文本的轻量型视觉语言模型

网络

2025-04-03

PocketFlow：一款核心代码只有100行的极简LLM框架

网络

2025-04-03

Step-Video-TI2V：阶跃星辰开源的一款AI文生视频和图生视频模型

网络

2025-04-03

XianyuAutoAgent：免费开源的智能闲鱼客服机器人系统

网络

2025-04-03

Second Me：让用户可以创建并训练自己的AI数字身份

网络

2025-04-03

谷歌 Gemini 2.0 Flash保姆式使用教程指南

网络

2025-04-03

MoneyPrinterTurbo：只需提供一个关键词，利用AI大模型，一键生成高清短视频。

网络

2025-04-03

Stable Virtual Camera：使用一张图片，可以生成360度旋转的3D视频

Stable Virtual Camera是什么？

Stable Virtual Camera功能

Stable Virtual Camera应用