Qwen3-235B-A22B-Thinking-2507-阿里推出的最新推理模型

Qwen3-235B-A22B-Thinking-2507-阿里推出的最新推理模型

文章来源:智汇AI    发布时间:2025-08-13

Qwen3-235B-A22B-Thinking-2507 是阿里巴巴发布的全球最强开源推理模型。基于2350亿参数的稀疏混合专家(MoE)架构,每次激活220

暂无访问

Qwen3-235B-A22B-Thinking-2507是什么

Qwen3-235B-A22B-Thinking-2507 是阿里巴巴发布的全球最强开源推理模型。基于2350亿参数的稀疏混合专家(MoE)架构,每次激活220亿参数,拥有94层Transformer网络和128个专家节点。模型专为复杂推理任务设计,支持256K原生上下文处理能力,可应对长文本和深度推理链。在性能方面,Qwen3-235B-A22B-Thinking-2507 在逻辑推理、数学、科学分析、编程等核心能力上显著提升,特别是在AIME25(数学)和LiveCodeBench v6(编程)等基准测试中刷新了全球开源模型的最佳成绩,超越了部分闭源模型。在知识、创意写作、多语言能力等通用任务上也表现出色。

模型采用Apache 2.0开源协议,免费商用,用户可通过QwenChat、魔搭社区或Hugging Face体验和下载。定价为每输入百万token 0.7美元,每输出百万token 8.4美元。

Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507的主要功能

逻辑推理:在逻辑推理任务中表现出色,能够处理复杂的多步推理问题。

相关推荐