首款专为大规模上下文AI设计的CUDAGPU,英伟达RubinCPX发布

首款专为大规模上下文AI设计的CUDAGPU,英伟达RubinCPX发布

文章来源:智汇AI    发布时间:2025-09-11

英伟达今日宣布推出新产品 Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。

暂无访问

智汇AI9月10日消息,英伟达今日宣布推出新产品RubinCPX,这是一款专为大规模上下文处理而设计的专用GPU,涵盖了像大规模编码和生成视频这样要求高的工作。

该硬件旨在将理解AI提示的任务与生成响应的任务区分开,英伟达表示,这将使整个过程对客户的效率更高。

该新硬件预计将作为较大的VeraRubin平台的一部分工作,该平台同时集成了VeraCPU和RubinGPU。英伟达声称全机架版本VeraRubinNVL144CPX拥有8exaflops的AI性能。

智汇AI从英伟达新闻稿获悉,独立的RubinCPXGPU包含128GB的GDDR7显存。英伟达承诺,新硬件具有3倍的attentioncapabilities,并使用公司的4-bitNVFP4精度提供30petaflops的计算能力。

英伟达CEO黄仁勋将RubinCPX与RTX进行了比较,他说:“正如RTX革新了图形和物理AI,RubinCPX是首款专为大规模上下文AI设计的CUDAGPU,能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报,提到部署新硬件的1亿美元投资可以产生50亿美元的收益。

英伟达表示,该硬件将得到其完整软件栈的支持,包括Nemotron——其一系列开放的多模态模型,专为构建企业级AI代理(旨在自主处理复杂任务的系统)而设计。Nemotron模型提供不同尺寸,从Nano用于设备端应用,到Super用于单GPU设置,再到Ultra用于大型数据中心。

英伟达表示,预计RubinCPX将于2026年底推出。

相关推荐