Meta发布Llama 3开源大模型
当地时间4月18日,硅谷人工智能大厂 Meta 正式推出旗下新一代的开源大语言模型 Llama 3。包括两个版本:Llama 3 8B 与 Llama 3 70B。其中参数量更少的Llama 3 8B在某些测评基准的项目成绩上,甚至超越了参数量更大的 70B版本。
据介绍,Llama 3 使用的数据量是 Llama 2 的七倍,模型性能和准确性提高,推理、代码生成和遵循指令等方面的能力取得突破,使其更加灵活和易于使用。
Meta 声称,基准测试显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试中击败 Google Gemma 7B 以及 Mistral 7B Instruct,而 Llama 3 70B 则略胜于 Gemini 1.5 Pro。
Meta 还透露,他们最大的模型参数超越 400B,接下来几个月将会推出具备多模态、多语言对话、更长上下文窗口等能力的新模型。