文章来源:智汇AI 发布时间:2025-12-03
Alpamayo-R1(AR1)是英伟达推出的视觉-语言-动作(VLA)模型,通过因果推理提升自动驾驶的决策能力和泛化性。模型的核心创新包括:构建因果链(CoC
暂无访问Alpamayo-R1(AR1)是英伟达推出的视觉-语言-动作(VLA)模型,通过因果推理提升自动驾驶的决策能力和泛化性。模型的核心创新包括:构建因果链(CoC)数据集,通过“人机协同+自动标注”生成高质量的推理轨迹;采用Cosmos-Reason作为VLM骨干网络,网络基于大量视觉问答样本训练,具备物理常识和具身推理能力;设计多阶段训练策略,结合监督微调和强化学习,优化推理质量和轨迹生成。AR1在实验中显著提升了规划精度,降低了越界率和近碰率,同时保持了99毫秒的低延迟,适合实时自动驾驶应用。
