文章来源:智汇AI 发布时间:2025-08-29
科技媒体WccfTech昨日(8月25日)发布博文,报道称在HotChips2025大会上,谷歌详细披露第七代TPU架构“Ironwood”超级计算平台。
暂无访问8月26日消息,科技媒体WccfTech昨日(8月25日)发布博文,报道称在HotChips2025大会上,谷歌详细披露第七代TPU架构“Ironwood”超级计算平台。
援引博文介绍,谷歌于今年4月官宣第7代TPU架构,代号为Ironwood,号称其性能是当前最强大超级计算机的24倍。
本次披露主要聚焦单个Superpod的硬件构成与架构设计。相比2022年的TPUv4(4096芯片、32GBHBM、275TFLOPs)和2023年的TPUv5p(8960芯片、95GBHBM、459TFLOPs),Ironwood在核心规格上大幅跃升。
单个IronwoodSuperpod集成9216枚芯片,每片配备192GB、带宽7.4TB/s的高带宽存储,峰值算力高达4614TFLOPs,意味着其单芯片性能较TPUv4提升超过16倍。
每四颗芯片组成一块PCBA主板,16块主板构成一个机架,共64芯片节点,谷歌采用InterChipInterconnect(ICI)技术,将多达43个64芯片模块互连,构建出拥有1.8PB/s网络带宽的集群。
在物理布局上,Ironwood沿用过去三代的3DTorus(立方环网)拓扑,每个逻辑单元为4×4×4节点阵列,即64芯片,封装于单个机架。
一个Superpod包含144个机架,还配备光学交换机机箱以实现跨模块互连,以及用于液冷的冷却分配单元(CBU)机架,互连方面为提高灵活性与可扩展性,采用PCB走线、铜缆和光纤的混合方式。
在机架设计上,顶部设有泄漏检测盘以监控液冷系统,下方是供电模块,具备两路电源域,将416V交流电经整流转换为直流电。整套系统支持液冷散热,满载运行功率可超过100kW。
简要介绍下上述专有名词:
TPU(TensorProcessingUnit)张量处理单元:谷歌专为机器学习任务设计的专用芯片,优化矩阵运算性能。
Superpod,就是一组连续的TPU,通过专用网络组合在一起。
HBM(HighBandwidthMemory)高带宽存储:一种集成在芯片附近的高速显存,显著提升数据传输速率。
TFLOPs(TeraFloatingPointOperationsperSecond)万亿次浮点运算/秒:衡量芯片浮点运算性能的指标。