GigaBrain-0-开源VLA具身模型,基于世界模型生成的数据

GigaBrain-0-开源VLA具身模型,基于世界模型生成的数据

文章来源:智汇AI    发布时间:2025-10-30

GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提

暂无访问

GigaBrain-0是什么

GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了跨任务泛化能力。采用 RGB-D 输入建模,增强了空间感知能力,通过具身思维链(Embodied CoT)监督,强化了模型在任务执行中的推理能力。使得 GigaBrain-0 在真实世界中的灵巧操作、长时程任务和移动操作任务中表现出色。GigaBrain-0 在外观、物体摆放位置和相机视角变化等场景下展现出优异的泛化能力。为适应边缘平台,推出了轻量级版本 GigaBrain-0-Small,实现在 NVIDIA Jetson AGX Orin 等设备上的高效运行。

GigaBrain-0

GigaBrain-0的主要功能

数据生成与依赖降低:利用世界模型生成多样化数据,如视频生成、Real2Real迁移、人类迁移等,减少对真实机器人数据的依赖,提升模型泛化能力。

相关推荐