Devstral 2-Mistral AI开源的新一代编程模型系列

文章来源：智汇AI 发布时间：2025-12-11

Devstral 2 是 Mistral AI 推出的新一代开源编程模型系列，包含 123B 参数的 Devstral 2 和 24B 参数的 Devstral

暂无访问

Devstral 2是什么

Devstral 2 是 Mistral AI 推出的新一代开源编程模型系列，包含 123B 参数的 Devstral 2 和 24B 参数的 Devstral Small 2。Devstral 2 拥有 256K 上下文窗口，SWE-bench 验证准确率高达 72.2%，性能卓越且成本高效，支持跨文件探索、架构级推理和自动修正等功能，适合企业级开发。Devstral Small 2 轻量级，可在消费级硬件上本地部署，支持多模态输入。两者均通过 Mistral Vibe CLI 提供终端交互式编程辅助，助力开发者高效完成任务，推动开源编程模型的发展。

Devstral 2的主要功能

跨文件代码理解和生成：Devstral 2 能理解和生成跨多个文件的代码，支持在大型代码库中进行复杂的代码修改和重构，同时保持架构级的上下文感知，帮助开发者高效处理多文件项目。架构级推理：模型能跟踪代码库的整体架构，理解框架依赖关系，在进行代码修改时保持整体架构的稳定性，避免因局部修改引发的全局问题。自动错误检测与修正：Devstral 2 能检测代码中的错误，尝试自动修正，通过多次尝试和验证来确保代码的正确性，在修复遗留系统中的问题时表现出色。支持多种编程语言：模型对多种主流编程语言有良好的支持能力，能根据需求生成和优化不同语言的代码，满足多样化的开发需求。高效的代码生成与优化：Devstral 2 能生成高质量、高效的代码，同时优化现有代码的性能，帮助开发者提升开发效率和代码质量。

Devstral 2的测试表现

SWE-bench Verified 测试Devstral 2（123B 参数）：准确率达到 72.2%，成为目前表现最好的开源模型之一。Devstral Small 2（24B 参数）：准确率为 68.0%，性能与体积是其五倍的模型相当。与竞品对比Devstral 2 与 DeepSeek V3.2 对比：胜率 42.8%，明显优于 DeepSeek V3.2（28.6%）。对比 Claude Sonnet 4.5（闭源模型）时：Claude Sonnet 4.5 仍更受欢迎，表明 Devstral 2 与顶级闭源模型仍有差距，但已非常接近。