AMD、高通宣布旗下硬件支持OpenAIgpt-oss开放推理模型

AMD、高通宣布旗下硬件支持OpenAIgpt-oss开放推理模型

文章来源:智汇AI    发布时间:2025-08-07

AMD 锐龙 AI Max+ 395 处理器支持 gpt-oss-120b。AMD Radeon RX 9070 16GB 显卡和高通旗舰骁龙平台支持 gpt-oss-20b。

暂无访问

智汇AI8月6日消息,OpenAI当地时间昨日以Apache2.0许可证的形式推出了两款gpt-oss系列开放推理模型,其中参数规模较小的gpt-oss-20b模型可在仅配备16GB内存的边缘设备上运行、参数更多的gpt-oss-120b则能在单个80GBGPU上高效运行。

AMD与高通均宣布旗下硬件支持gpt-oss系列开放模型,具体是AMD锐龙AIMax+395处理器支持gpt-oss-120b、AMDRadeonRX907016GB显卡支持gpt-oss-20b、高通旗舰骁龙平台支持gpt-oss-20b。

AMD宣称锐龙AIMax+395是全球首款能运行gpt-oss-120b模型的消费级AIPC处理器:采用GGML框架转换的MXFP4格式gpt-oss-120b大约需要61GB显存,而"StrixHalo"平台在128GB统一内存下支持将96GB分配给GPU,轻松满足这一需求。

锐龙AIMax+395在gpt-oss-120b上有30Token/s的输出速率,同时支持该模型的MCP模型上下文协议实现。

而RadeonRX907016GB显卡则能在gpt-oss-20b上实现出色的首Token输出时间(TTFT)和每秒Token输出数量表现。

高通表示根据早期测试gpt-oss-20b可在端侧实现出色思维链推理表现,开发者可通过HuggingFace和Ollama等热门平台在搭载骁龙芯片的设备上访问gpt-oss-20b模型并充分发挥其功能。

相关推荐