文章来源:智汇AI 发布时间:2025-08-06
Llama 3.1是Meta最新发布的开源AI模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参数量成为目前最大的开源模型之一。Llam
暂无访问Llama 3.1是Meta最新发布的开源AI模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参数量成为目前最大的开源模型之一。Llama 3.1支持128K的上下文长度,能够处理长文本并具备多语言翻译能力。在多个AI基准测试中表现卓越,尤其在数学、推理和长文本处理方面,与市场上顶尖的闭源模型如GPT-4o和Claude 3.5 Sonnet相媲美。此外,Meta还提供了Llama Stack API和安全工具,推动了AI创新应用的开发。
Meta 评估了超过了 150 个基准数据集的性能,比较了 Llama 3.1 与其他模型在现实情况下的能力表现,405B 模型在包括 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 在内的一系列任务中与领先的基础模型具有竞争力。此外,较小模型与具有相似参数数量的封闭和开放模型具有竞争力。
8B 和 70B 模型在基准测试中取得了显著进步:Llama 3.1 在基准测试中表现优异。8B 模型在 MMLU 测试中从 65 分提升到 73 分(提高 8 分),70B 模型从 81 分提升到 86 分(提高 5 分)。在 MATH (数学问题解决) 测试中,8B 模型的得分从 29 分大幅提升到 52 分(提高 23 分)。
Llama 3.1 405B 在通用任务、知识推理、阅读理解上创下最新纪录。尤其在,MMLU、SQuAD 细分基准上,提升最为明显。Llama 3.1 8B 和 70B 参数版本,相较于 Llama 3,得到了细微地改善。Llama 3.1 405B 比预训练模型更强。在推理、代码、数学、工具使用、多语言基准上,纷纷碾压微调后的 8B 和 70B 版本。