腾讯混元Hunyuan-A13B模型API上线：AI开发新利器来袭

文章来源：智汇AI 发布时间：2025-07-15

在AI开发竞争激烈的时代，开发者们一直渴望更高效、性价比更高的工具。近日，腾讯云官网正式上线腾讯混元A13B模型API服务，作为业界首个13B级别MoE开源混合推理模型，它以超高性价比、强大能力等优…

暂无访问

腾讯混元Hunyuan-A13B模型API上线

近日，腾讯云官网干了一件大事，正式上线了腾讯混元A13B模型的API服务。这一消息就像一颗石子投入平静的湖面，在开发者社区激起了层层热烈反响。毕竟，这背后可是藏着能改变AI开发格局的“秘密武器”。

查看地址：https://cloud.tencent.com/product/tclm

腾讯混元Hunyuan-A13B模型是什么？

腾讯混元Hunyuan-A13B模型是腾讯于2025年6月27日开源的首个混合推理MoE模型，也是业界首个13B级别的MoE开源混合推理模型。

以下是其详细介绍：

模型参数

总参数80B，激活参数仅13B。效果比肩同等架构领先开源模型，但推理速度更快，性价比更高。

性能特点

强大的通用能力在多个业内权威数据测试集上表现出色，在数学、推理、Agent调用等能力上超越Qwen3-A22B、DeepSeek-R1-0120以及OpenAI-o1-1217等模型。突出的长文能力支持256K原生上下文窗口，在PenguinScrolls和LongBench-v2等长文数据集中仅次于Gemini2.5pro。高效的Agent工具调用通过建设多Agent数据合成框架，接入多种环境，经强化学习让Agent自主探索学习，可根据用户指令调用搜索、酒店、天气等查询工具，生成出行攻略等，还能调用编码工具完成数据分析并生成新的excel表格文件。灵活的思考模式可选择“快思考”和“慢思考”模式。“快思考”提供简洁高效输出，适合简单任务；“慢思考”有更深更全面的推理步骤，用户可在效率和准确性间取得平衡。

部署要求

对个人开发者友好，严格条件下只需1张中低端GPU卡即可部署。目前已融入开源主流推理框架生态，无损支持多种量化格式，相同输入输出规模下，整体吞吐是前沿开源模型的2倍以上。

预训练与后训练技术

预训练环节使用20Ttokens的语料，覆盖多个领域，并构建了适用于MoE架构的ScalingLaw联合公式，提升了预训练效果。后训练采用多阶段训练方式，兼顾模型创作、理解、Agent等通用能力。

开源情况

模型已在Github和Huggingface等开源社区上线，模型API也在腾讯云官网正式上线，支持快速接入部署。同时，还配套开源了ArtifactsBench和C3-Bench两大专业评测数据集，前者用于弥合大语言模型代码生成评估中的视觉与交互鸿沟，后者针对Agent场景模型面临的关键挑战设计，以发现模型能力不足。

腾讯混元Hunyuan-A13B模型API定价

先来说说大家最关心的价格。腾讯混元A13B模型API的输入价格定为每百万Tokens0.5元，输出价格是每百万Tokens2元。这价格在同类产品里相当有竞争力。

而且，它还是业界首个13B级别的MoE（混合专家）开源混合推理模型。别看它总参数有80B，可激活参数仅13B，这种精简设计让它实现了和同等架构领先开源模型差不多的效果，在推理速度上还更胜一筹，性价比直接拉满。对于开发者来说，这意味着可以用更低的成本获取先进的模型能力，AI应用的普及之路这下更顺畅了。

腾讯混元Hunyuan-A13B模型性能表现

Hunyuan-A13B模型依托先进的架构设计，就像一个十八般武艺样样精通的高手，展现出了强大的通用能力。在多个业内权威数据测试集上，它都取得了优异成绩，特别是在Agent工具调用和长文处理方面，表现堪称惊艳。

为了提升Agent能力，腾讯混元团队下了不少功夫。他们构建了一套多Agent数据合成框架，接入MCP、沙箱、大语言模型模拟等多样环境，还利用强化学习技术，让Agent在这些环境里自主探索学习。就好比给Agent请了个好老师，让它不断成长进步，最终显著提升了模型的实用性和效果。

在长文处理方面，Hunyuan-A13B支持256K原生上下文窗口，能在多个长文数据集中保持优异表现。更厉害的是，它还创新性地引入了融合推理模式。用户可以根据任务需求，在快思考和慢思考模式间自由切换。这就好比开车时可以根据路况在自动挡和手动挡之间切换，既保证了输出效率，又兼顾了特定任务的准确性，实现了计算资源的优化分配。

对个人开发者友好，性能卓越灵活

对于个人开发者来说，Hunyuan-A13B模型就像一个贴心的好伙伴，友好度极高。在严格条件下，仅需1张中低端GPU卡就能完成部署。目前，该模型已经无缝融入开源主流推理框架生态，支持多种量化格式。而且，在相同输入输出规模上，它的整体吞吐量是前沿开源模型的2倍以上，这性能和灵活性简直没话说。

创新技术加持，实力铸就成功

Hunyuan-A13B模型能取得这样的成功，离不开腾讯混元团队在模型预训练和后训练环节的创新技术。在预训练阶段，团队训练了高达20Ttokens的语料库，覆盖了多个领域，就像给模型喂了海量的知识，显著提升了模型的通用能力。同时，通过系统性分析和建模验证，团队还构建了适用于MoE架构的ScalingLaw联合公式，为MoE架构设计提供了可量化的工程化指导。

后训练阶段，团队采用了多阶段训练方式，进一步提升了模型的推理能力和通用性。就像打磨一块璞玉，经过精心雕琢，让它变得更加完美。