Mistral AI新品Devstral2507:为开发者量身打造的代码神器

Mistral AI新品Devstral2507:为开发者量身打造的代码神器

文章来源:智汇AI    发布时间:2025-07-15

开发者处理大型软件代码库时,常被代码推理、程序合成等难题困扰,如同在复杂迷宫中艰难摸索。不过别愁啦!近日,Mistral AI 携手 All Hands AI推出Devstral2507系列大型语言…

暂无访问

对于开发者们来说,在处理大型软件代码库时,常常会遇到各种难题,像代码推理、程序合成还有结构化任务执行等等,就像在迷宫里找出口,既费时又费力。

不过别担心,MistralAI和AllHandsAI携手合作,推出了专门为开发者打造的Devstral2507系列大型语言模型,这就像是给开发者们配备了一把万能钥匙,能轻松打开代码世界的大门。

模型地址:https://huggingface.co/mistralai/Devstral-Small-2507

体验地址:MistralAI网页版官网入口

Devstral2507系列两大模型闪亮登场

Devstral2507系列包含两款新模型,分别是DevstralSmall1.1和DevstralMedium2507。这两款模型就像是一对默契的搭档,各有各的本领,能满足开发者不同的需求。

DevstralSmall1.1:开源小能手

DevstralSmall1.1是开源模型,它基于Mistral-Small-3.1基础模型,拥有大约240亿个参数。这参数数量虽然不算特别庞大,但它的能力可不容小觑。它支持128k的上下文窗口,能轻松处理多文件代码输入和复杂的长提示,就像一个记忆力超强的小助手,能把各种代码信息都牢牢记住。

这个模型还特别针对结构化输出进行了微调,像XML和函数调用格式这些都不在话下,能和OpenHands等代理框架完美兼容。不管是程序导航、多步骤编辑还是代码搜索等任务,它都能轻松胜任。而且它的许可为Apache2.0,既可以用于研究,也能用于商业用途,非常灵活。

在性能测试方面,DevstralSmall1.1在SWE-BenchVerified基准测试中获得了53.6%的成绩,这说明它在为真实的GitHub问题生成正确补丁方面表现相当出色。虽然和一些大型商业模型相比,它的性能还有一定的差距,但它在大小、推理成本和推理能力之间找到了一个很好的平衡点,对于多种编码任务来说,都是个不错的选择。

为了让更多开发者能方便地使用,这个模型以多种格式发布。你可以在高内存GPU(比如RTX4090)或者32GBRAM以上的AppleSilicon机器上进行本地推理的量化版本。同时,Mistral还通过其推理API提供模型,当前的收费标准和Mistral-Small系列模型一样,性价比超高。

DevstralMedium2507:高性能实力派

DevstralMedium2507则和Small版本不同,它仅通过MistralAPI或企业部署协议提供,不开放源代码。这就像是一个神秘的高手,有着自己独特的技能。在SWE-BenchVerified基准测试中,它得分为61.6%,在长上下文的推理能力上表现出色,甚至能超越一些商业模型,比如Gemini2.5Pro和GPT-4.1。

虽然它的API收费标准比Small版本高一些,但它强大的推理能力,让它非常适合在大型代码库中执行任务。无论是复杂的代码分析还是大规模的程序合成,它都能游刃有余。

两款模型适用场景大不同

这两款模型在设计上都支持与代码代理框架集成,能简化测试生成、重构和错误修复的自动化工作流程。不过,它们也有各自更适合的场景。

DevstralSmall更适合本地开发、实验或者集成到客户端开发工具中。如果你是一个喜欢自己动手折腾代码,或者想把模型集成到自己常用的开发工具里,提高开发效率,那么DevstralSmall就是你的不二之选。

而DevstralMedium则在结构化代码编辑任务中提供更高的准确性和一致性,适合需要高性能的生产服务。如果你的项目规模比较大,对代码的质量和准确性要求很高,那么DevstralMedium就能发挥出它的优势,为你的项目保驾护航。

开启开发新增程

MistralAI的Devstral2507系列为开发者提供了不同的选择,就像一个丰富的工具箱,无论你是进行实验性的代理开发,还是在商业环境中实际部署,都能从中找到适合自己的工具。

相关推荐