文章来源:智汇AI 发布时间:2025-07-29
Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型,具有多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训
暂无访问Qwen2.5 是阿里通义千问团队最新开源的最强AI大模型,具有多种参数规模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在预训练时使用了最新的大规模数据集,包含多达 18 万亿个 tokens,Qwen2.5 在自然语言理解、文本生成、编程能力、数学能力等方面都有显著提升。Qwen2.5 支持长文本处理,能生成长文本(超过 8K tokens),增强对系统提示的适应性,提升角色扮演和聊天机器人的背景设置能力。Qwen2.5 还支持多达 29 种语言,包括中文、英文、法文、西班牙文、葡萄牙文、德文等。Qwen2.5-Coder 和 Qwen2.5-Math 是针对编程和数学问题的专门模型,在专业领域内展现了强大的性能。
Qwen2.5 模型在 MMLU-rudex 基准(考察通用知识)、MBPP 基准(考察代码能力)和 MATH 基准(考察数学能力)上的得分分别高达 86.8、88.2、83.1。
Qwen2.5:包括 0.5B、1.5B、3B、7B、14B、32B 和 72B 参数规模的模型。包含多达 18 万亿个 tokens,相比 Qwen2,整体性能提升了 18% 以上。支持高达 128K tokens 的上下文长度,能生成最长 8K tokens 的内容。支持超过 29 种语言,包括中文、英文等。Qwen2.5-Coder专注于编程任务的模型,包括 1.5B 和 7B 参数规模。以及即将推出的 32B 版本。在多达 5.5 万亿 tokens 的编程相关数据上进行了训练。覆盖 92 种编程语言、支持 128K tokens 的上下文长度,能生成最多 8K tokens 的内容。Qwen2.5-Math专注于数学问题的模型,包括 1.5B、7B 和 72B 参数规模。支持中文和英文,整合多种推理方法,包括思维链(CoT)、程序化思维(PoT)和工具集成推理(TIR)。解决中英双语的数学题方面表现出色 。