文章来源:智汇AI 发布时间:2025-07-15
在AI开发竞争激烈的时代,开发者们一直渴望更高效、性价比更高的工具。近日,腾讯云官网正式上线腾讯混元A13B模型API服务,作为业界首个13B级别MoE开源混合推理模型,它以超高性价比、强大能力等优…
暂无访问近日,腾讯云官网干了一件大事,正式上线了腾讯混元A13B模型的API服务。这一消息就像一颗石子投入平静的湖面,在开发者社区激起了层层热烈反响。毕竟,这背后可是藏着能改变AI开发格局的“秘密武器”。
查看地址:https://cloud.tencent.com/product/tclm
腾讯混元Hunyuan-A13B模型是腾讯于2025年6月27日开源的首个混合推理MoE模型,也是业界首个13B级别的MoE开源混合推理模型。
以下是其详细介绍:
总参数80B,激活参数仅13B。效果比肩同等架构领先开源模型,但推理速度更快,性价比更高。
强大的通用能力在多个业内权威数据测试集上表现出色,在数学、推理、Agent调用等能力上超越Qwen3-A22B、DeepSeek-R1-0120以及OpenAI-o1-1217等模型。突出的长文能力支持256K原生上下文窗口,在PenguinScrolls和LongBench-v2等长文数据集中仅次于Gemini2.5pro。高效的Agent工具调用通过建设多Agent数据合成框架,接入多种环境,经强化学习让Agent自主探索学习,可根据用户指令调用搜索、酒店、天气等查询工具,生成出行攻略等,还能调用编码工具完成数据分析并生成新的excel表格文件。灵活的思考模式可选择“快思考”和“慢思考”模式。“快思考”提供简洁高效输出,适合简单任务;“慢思考”有更深更全面的推理步骤,用户可在效率和准确性间取得平衡。
对个人开发者友好,严格条件下只需1张中低端GPU卡即可部署。目前已融入开源主流推理框架生态,无损支持多种量化格式,相同输入输出规模下,整体吞吐是前沿开源模型的2倍以上。
预训练环节使用20Ttokens的语料,覆盖多个领域,并构建了适用于MoE架构的ScalingLaw联合公式,提升了预训练效果。后训练采用多阶段训练方式,兼顾模型创作、理解、Agent等通用能力。
模型已在Github和Huggingface等开源社区上线,模型API也在腾讯云官网正式上线,支持快速接入部署。同时,还配套开源了ArtifactsBench和C3-Bench两大专业评测数据集,前者用于弥合大语言模型代码生成评估中的视觉与交互鸿沟,后者针对Agent场景模型面临的关键挑战设计,以发现模型能力不足。
先来说说大家最关心的价格。腾讯混元A13B模型API的输入价格定为每百万Tokens0.5元,输出价格是每百万Tokens2元。这价格在同类产品里相当有竞争力。
而且,它还是业界首个13B级别的MoE(混合专家)开源混合推理模型。别看它总参数有80B,可激活参数仅13B,这种精简设计让它实现了和同等架构领先开源模型差不多的效果,在推理速度上还更胜一筹,性价比直接拉满。对于开发者来说,这意味着可以用更低的成本获取先进的模型能力,AI应用的普及之路这下更顺畅了。
Hunyuan-A13B模型依托先进的架构设计,就像一个十八般武艺样样精通的高手,展现出了强大的通用能力。在多个业内权威数据测试集上,它都取得了优异成绩,特别是在Agent工具调用和长文处理方面,表现堪称惊艳。
为了提升Agent能力,腾讯混元团队下了不少功夫。他们构建了一套多Agent数据合成框架,接入MCP、沙箱、大语言模型模拟等多样环境,还利用强化学习技术,让Agent在这些环境里自主探索学习。就好比给Agent请了个好老师,让它不断成长进步,最终显著提升了模型的实用性和效果。
在长文处理方面,Hunyuan-A13B支持256K原生上下文窗口,能在多个长文数据集中保持优异表现。更厉害的是,它还创新性地引入了融合推理模式。用户可以根据任务需求,在快思考和慢思考模式间自由切换。这就好比开车时可以根据路况在自动挡和手动挡之间切换,既保证了输出效率,又兼顾了特定任务的准确性,实现了计算资源的优化分配。
对于个人开发者来说,Hunyuan-A13B模型就像一个贴心的好伙伴,友好度极高。在严格条件下,仅需1张中低端GPU卡就能完成部署。目前,该模型已经无缝融入开源主流推理框架生态,支持多种量化格式。而且,在相同输入输出规模上,它的整体吞吐量是前沿开源模型的2倍以上,这性能和灵活性简直没话说。
Hunyuan-A13B模型能取得这样的成功,离不开腾讯混元团队在模型预训练和后训练环节的创新技术。在预训练阶段,团队训练了高达20Ttokens的语料库,覆盖了多个领域,就像给模型喂了海量的知识,显著提升了模型的通用能力。同时,通过系统性分析和建模验证,团队还构建了适用于MoE架构的ScalingLaw联合公式,为MoE架构设计提供了可量化的工程化指导。
后训练阶段,团队采用了多阶段训练方式,进一步提升了模型的推理能力和通用性。就像打磨一块璞玉,经过精心雕琢,让它变得更加完美。
作为腾讯内部应用和调用量最大的大语言模型之一,Hunyuan-A13B已经广泛应用于400多个业务场景,日均请求量超过1.3亿次。这么多业务场景的应用,充分证明了它在实际应用中的价值和稳定性。就像一个久经沙场的老将,在各种复杂的环境中都能游刃有余。
腾讯混元Hunyuan-A13B模型API的上线,无疑为AI开发领域带来了新的活力和机遇。无论是开发者还是企业,都能从中受益。