MobileLLM-R1-Meta推出的专项高效推理模型系列

MobileLLM-R1-Meta推出的专项高效推理模型系列

文章来源:智汇AI    发布时间:2025-09-15

MobileLLM-R1是Meta推出的一系列专为数学、编程和科学推理设计的高效推理模型。系列包含基础模型和最终模型,分别有1.4亿、3.6亿和9.5亿参数版本

暂无访问

MobileLLM-R1是什么

MobileLLM-R1是Meta推出的一系列专为数学、编程和科学推理设计的高效推理模型。系列包含基础模型和最终模型,分别有1.4亿、3.6亿和9.5亿参数版本。模型并非通用聊天模型,是经过监督微调(SFT)的专项模型,专注于特定任务的高效推理。MobileLLM-R1-950M模型仅用约2万亿高质量token进行预训练,总训练token量少于5万亿,但在多个基准测试中表现优异。例如,在数学基准测试中,其准确率显著优于其他同类模型,如Olmo 1.24B和SmolLM2 1.7B。在编程能力测试中,它也大幅领先于其他模型,展现出强大的推理和代码生成能力。

MobileLLM-R1

MobileLLM-R1的主要功能

数学推理:MobileLLM-R1 在数学问题解答方面表现出色,能准确处理复杂的数学题目。例如,在数学基准测试中,其准确率显著高于其他同类模型,如 Olmo 1.24B 和 SmolLM2 1.7B,展现出强大的数学推理能力。

相关推荐