Alpamayo-R1-英伟达推出的推理版视觉-语言-动作模型

文章来源：智汇AI 发布时间：2025-12-03

Alpamayo-R1（AR1）是英伟达推出的视觉-语言-动作（VLA）模型，通过因果推理提升自动驾驶的决策能力和泛化性。模型的核心创新包括：构建因果链（CoC

暂无访问

Alpamayo-R1是什么

Alpamayo-R1（AR1）是英伟达推出的视觉-语言-动作（VLA）模型，通过因果推理提升自动驾驶的决策能力和泛化性。模型的核心创新包括：构建因果链（CoC）数据集，通过“人机协同+自动标注”生成高质量的推理轨迹；采用Cosmos-Reason作为VLM骨干网络，网络基于大量视觉问答样本训练，具备物理常识和具身推理能力；设计多阶段训练策略，结合监督微调和强化学习，优化推理质量和轨迹生成。AR1在实验中显著提升了规划精度，降低了越界率和近碰率，同时保持了99毫秒的低延迟，适合实时自动驾驶应用。