Devstral 2-Mistral AI开源的新一代编程模型系列

Devstral 2-Mistral AI开源的新一代编程模型系列

文章来源:智汇AI    发布时间:2025-12-11

Devstral 2 是 Mistral AI 推出的新一代开源编程模型系列,包含 123B 参数的 Devstral 2 和 24B 参数的 Devstral

暂无访问

Devstral 2是什么

Devstral 2 是 Mistral AI 推出的新一代开源编程模型系列,包含 123B 参数的 Devstral 2 和 24B 参数的 Devstral Small 2。Devstral 2 拥有 256K 上下文窗口,SWE-bench 验证准确率高达 72.2%,性能卓越且成本高效,支持跨文件探索、架构级推理和自动修正等功能,适合企业级开发。Devstral Small 2 轻量级,可在消费级硬件上本地部署,支持多模态输入。两者均通过 Mistral Vibe CLI 提供终端交互式编程辅助,助力开发者高效完成任务,推动开源编程模型的发展。

Devstral 2

Devstral 2的主要功能

跨文件代码理解和生成:Devstral 2 能理解和生成跨多个文件的代码,支持在大型代码库中进行复杂的代码修改和重构,同时保持架构级的上下文感知,帮助开发者高效处理多文件项目。架构级推理:模型能跟踪代码库的整体架构,理解框架依赖关系,在进行代码修改时保持整体架构的稳定性,避免因局部修改引发的全局问题。自动错误检测与修正:Devstral 2 能检测代码中的错误,尝试自动修正,通过多次尝试和验证来确保代码的正确性,在修复遗留系统中的问题时表现出色。支持多种编程语言:模型对多种主流编程语言有良好的支持能力,能根据需求生成和优化不同语言的代码,满足多样化的开发需求。高效的代码生成与优化:Devstral 2 能生成高质量、高效的代码,同时优化现有代码的性能,帮助开发者提升开发效率和代码质量。

Devstral 2的测试表现

SWE-bench Verified 测试Devstral 2(123B 参数):准确率达到 72.2%,成为目前表现最好的开源模型之一。Devstral Small 2(24B 参数):准确率为 68.0%,性能与体积是其五倍的模型相当。与竞品对比Devstral 2 与 DeepSeek V3.2 对比:胜率 42.8%,明显优于 DeepSeek V3.2(28.6%)。对比 Claude Sonnet 4.5(闭源模型)时:Claude Sonnet 4.5 仍更受欢迎,表明 Devstral 2 与顶级闭源模型仍有差距,但已非常接近。Devstral 2

Devstral 2项目地址

项目官网:https://mistral.ai/news/devstral-2-vibe-cliHuggingFace模型库:https://huggingface.co/collections/mistralai/devstral-2

Devstral 2产品定价

Devstral 2(123B 参数):目前通过 API 免费提供。免费期结束后,API 定价为每百万输入 / 输出 token 分别为 0.40 美元 和 2.00 美元。

相关推荐