文章来源:智汇AI 发布时间:2025-09-15
MobileLLM-R1是Meta推出的一系列专为数学、编程和科学推理设计的高效推理模型。系列包含基础模型和最终模型,分别有1.4亿、3.6亿和9.5亿参数版本
暂无访问MobileLLM-R1是Meta推出的一系列专为数学、编程和科学推理设计的高效推理模型。系列包含基础模型和最终模型,分别有1.4亿、3.6亿和9.5亿参数版本。模型并非通用聊天模型,是经过监督微调(SFT)的专项模型,专注于特定任务的高效推理。MobileLLM-R1-950M模型仅用约2万亿高质量token进行预训练,总训练token量少于5万亿,但在多个基准测试中表现优异。例如,在数学基准测试中,其准确率显著优于其他同类模型,如Olmo 1.24B和SmolLM2 1.7B。在编程能力测试中,它也大幅领先于其他模型,展现出强大的推理和代码生成能力。