 
                            文章来源:智汇AI 发布时间:2025-10-30
GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提
暂无访问GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了跨任务泛化能力。采用 RGB-D 输入建模,增强了空间感知能力,通过具身思维链(Embodied CoT)监督,强化了模型在任务执行中的推理能力。使得 GigaBrain-0 在真实世界中的灵巧操作、长时程任务和移动操作任务中表现出色。GigaBrain-0 在外观、物体摆放位置和相机视角变化等场景下展现出优异的泛化能力。为适应边缘平台,推出了轻量级版本 GigaBrain-0-Small,实现在 NVIDIA Jetson AGX Orin 等设备上的高效运行。
