对于开发者们来说,在处理大型软件代码库时,常常会遇到各种难题,像代码推理、程序合成还有结构化任务执行等等,就像在迷宫里找出口,既费时又费力。
不过别担心,Mistral AI和All Hands AI携手合作,推出了专门为开发者打造的Devstral2507系列大型语言模型,这就像是给开发者们配备了一把万能钥匙,能轻松打开代码世界的大门。
模型地址: https://huggingface.co/mistralai/Devstral-Small-2507
体验地址:Mistral AI网页版官网入口
Devstral2507系列两大模型闪亮登场
Devstral2507系列包含两款新模型,分别是Devstral Small1.1和Devstral Medium2507。这两款模型就像是一对默契的搭档,各有各的本领,能满足开发者不同的需求。
Devstral Small1.1:开源小能手
Devstral Small1.1 是开源模型,它基于Mistral-Small-3.1基础模型,拥有大约240亿个参数。这参数数量虽然不算特别庞大,但它的能力可不容小觑。它支持128k的上下文窗口,能轻松处理多文件代码输入和复杂的长提示,就像一个记忆力超强的小助手,能把各种代码信息都牢牢记住。
这个模型还特别针对结构化输出进行了微调,像XML和函数调用格式这些都不在话下,能和OpenHands等代理框架完美兼容。不管是程序导航、多步骤编辑还是代码搜索等任务,它都能轻松胜任。而且它的许可为Apache2.0,既可以用于研究,也能用于商业用途,非常灵活。
在性能测试方面,Devstral Small1.1在SWE-Bench Verified基准测试中获得了53.6%的成绩,这说明它在为真实的 GitHub 问题生成正确补丁方面表现相当出色。虽然和一些大型商业模型相比,它的性能还有一定的差距,但它在大小、推理成本和推理能力之间找到了一个很好的平衡点,对于多种编码任务来说,都是个不错的选择。
为了让更多开发者能方便地使用,这个模型以多种格式发布。你可以在高内存GPU(比如 RTX4090)或者32GB RAM以上的 Apple Silicon机器上进行本地推理的量化版本。同时,Mistral还通过其推理API提供模型,当前的收费标准和 Mistral-Small 系列模型一样,性价比超高。
Devstral Medium2507:高性能实力派
Devstral Medium2507则和Small版本不同,它仅通过Mistral API或企业部署协议提供,不开放源代码。这就像是一个神秘的高手,有着自己独特的技能。在SWE-Bench Verified基准测试中,它得分为61.6%,在长上下文的推理能力上表现出色,甚至能超越一些商业模型,比如Gemini2.5Pro和GPT-4.1。
虽然它的 API 收费标准比 Small 版本高一些,但它强大的推理能力,让它非常适合在大型代码库中执行任务。无论是复杂的代码分析还是大规模的程序合成,它都能游刃有余。
两款模型适用场景大不同
这两款模型在设计上都支持与代码代理框架集成,能简化测试生成、重构和错误修复的自动化工作流程。不过,它们也有各自更适合的场景。
Devstral Small 更适合本地开发、实验或者集成到客户端开发工具中。如果你是一个喜欢自己动手折腾代码,或者想把模型集成到自己常用的开发工具里,提高开发效率,那么 Devstral Small 就是你的不二之选。
而 Devstral Medium 则在结构化代码编辑任务中提供更高的准确性和一致性,适合需要高性能的生产服务。如果你的项目规模比较大,对代码的质量和准确性要求很高,那么 Devstral Medium 就能发挥出它的优势,为你的项目保驾护航。
开启开发新增程
Mistral AI的Devstral2507系列为开发者提供了不同的选择,就像一个丰富的工具箱,无论你是进行实验性的代理开发,还是在商业环境中实际部署,都能从中找到适合自己的工具。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: