文章来源:智汇AI 发布时间:2025-06-19
在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。
暂无访问智汇AI6月13日消息,在今日凌晨的AMDAdvancingAI2025活动中,AMD正式推出其下一代开源软件栈技术ROCm7,进一步加速AI与开发者生产力。
随着ROCm7的发布,AMD终于从其ROCm6软件栈向前迈进,该软件栈在过去几年中——尤其是在AI计算出现以来——已经经历了多次更新。以下是AMD在ROCm7中重点关注的一些功能:
最新算法与模型
用于扩展AI的高级功能
MI350系列支持
集群管理
企业级功能
通过ROCm,AMD表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm7堆栈将包括增强型框架,如vLLMv1、llm-d、SGLang,并专注于提供多种优化。即将到来的ROCm7新内核和算法包括GEMM自动调优、MoE、Attention和基于Python的内核编写。
AMD已宣布对其MI350系列提供FP6和FP4支持,ROCm7也包含对这些高级数据类型的全面支持,如FP8、FP6、FP4和混合精度。
智汇AI从发布会获悉,在性能方面,AMD表示ROCm7将推理作为重点,为AI工作负载带来了高达3.5倍的性能提升。
具体来看,相较于ROCm6,ROCm7的Llama3.170B提升了3.2倍,Qwen2-72B提升了3.4倍,DeepSeekR1提升了3.8倍。