文章来源:智汇AI 发布时间:2025-08-26
智汇AI8月26日消息,NVIDIA一直在准备Blackwell GPU的升级版本“Blackwell Ultra”,也就是B300、GB300
暂无访问智汇AI8月26日消息,NVIDIA一直在准备BlackwellGPU的升级版本“BlackwellUltra”,也就是B300、GB300,当然还是面向AI与高性能计算领域,今年晚些时候就会推出,然后才是下一代全新的“Rubin”。
BlackwellUltra仍然是台积电4NP工艺、2080亿个晶体管,还是两个Die通过NV-HBI高速界面互连(带宽10TB/s),配备总计160个SM单元(每个包含128个CUDA核心)、640个第五代Tensor核心,共享完全一致性的二级缓存。
GPU、GPU之间通过1.8TB/s带宽的第五代NVLink互连,GPU、CPU之间则是900GB/s的NVLink-C2C通道,这些都没变。
不同的是,BlackwellUltra将首次开放PCIe6.0支持,可用带宽直接翻倍,HBM3E内存容量也从192GB增加到288GB(带宽8TB/s),不过代价是最大功耗从1200W增加至1400W。
从NVIDIA的描述看,Blackwell本身就支持PCIe6.0,只不过在此之前一直没有开放而已。
性能方面,显著提升的一是NVFP4dense稠密性能大幅提升了50%而来到15PFlops,不过sparse稀疏性能还是20PFlops。
二是SFU(特殊功能单元)EX2下的注意力加速能力从5TF/s来到10.7TF/s,翻了一番还多。
FP8、FP16、TF16等数据格式的性能,则基本没有变化。
BlackwellUltra的主要部署形势是GB300NV72服务器,液冷机架,每个节点还是包含两颗B300GPU、一颗GraceGPU。