• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

Mistral放大招!开源Devstral,小身材爆发大能量,程序员福音来了!

Mistral放大招!开源Devstral,小身材爆发大能量,程序员福音来了!
AI TOP100
2025-05-22 10:50:32

最近,法国的人工智能模型制造商Mistral可谓是搞了个大新闻,在之前因为闭源模型Medium3 被喷后,立马来了个华丽转身,重回开源阵营!这次他们联手开源新秀 All Hands AI (就是搞出 OpenDevin 的那家公司),推出了一个全新的开源语言模型——Devstral。

这个 Devstral 可不简单,虽然只有2400万参数,是个轻量级选手,但它是专门为 AI 代理软件开发设计的。厉害的是,在某些基准测试中,它的性能甚至超过了那些动辄几十亿参数的竞争对手,包括一些闭源的大佬!这简直就是小身材,大能量啊!

Devstral:不止是代码生成,更是AI开发好帮手

和那些只会代码补全或者生成独立函数的传统LLM不同,Devstral可是优化过的,能当一个完整的软件工程代理使。啥意思呢?就是说它能理解跨文件的上下文,还能在大型代码库里自由穿梭,帮你解决实际的软件开发问题。更赞的是,Devstral 基于宽松的 Apache2.0许可证发布,这意味着开发者和公司可以随便用、随便改、随便商用,简直不要太爽!

Mistral AI 的研究科学家 Baptiste Rozière 说了,他们就是想给开发者社区提供一个可以在本地私下运行,并且能根据需求修改的开源工具。Apache2.0 协议给了用户极大的自由度,想咋玩就咋玩!

Mistral

Codestral 的升级版,更上一层楼

Devstral 可以说是 Mistral 以代码为中心的模型系列 Codestral 的最新升级版。Codestral 是在 2024 年 5 月首次亮相的,它有 220 亿参数,支持 80 多种编程语言,在代码生成和补全方面表现非常出色。Codestral 的快速迭代,催生了增强版 Codestral-Mamba 以及最新的 Codestral25.01,后者尤其受到 IDE 插件开发者和企业用户的喜爱。可以说,Codestral 系列的成功为 Devstral 的诞生奠定了坚实的基础,让它能从简单的代码补全扩展到完整的代理任务执行。

SWE 基准测试:成绩亮瞎眼!

在 SWE-Bench Verified 基准测试中,Devstral 取得了 46.8% 的好成绩。这个 SWE-Bench Verified 可不是闹着玩的,它包含了 500 个真实的 GitHub 问题,并且经过人工验证以确保其正确性。Devstral 的这个成绩,不仅领先于之前发布的所有开源模型,甚至超越了包括 GPT-4.1-mini 在内的多个闭源模型,领先幅度超过 20 个百分点!

Rozière 自豪地说,Devstral 是目前为止在 SWE-bench 验证和代码代理方面表现最好的开源模型,而且更令人惊讶的是,它只有 2400 万参数,甚至可以在 MacBook 上本地运行。Mistral AI 开发者关系主管 Sophia Yang 博士也在社交媒体上表示,Devstral 在各种框架下的评估中都优于许多闭源替代方案。

Devstral 的卓越性能得益于对 Mistral Small3.1 基础模型进行的强化学习和安全调整技术。Rozière 解释说,他们首先选择了一个强大的基础模型,然后利用专门的技术提升了其在 SWE-bench 上的表现。

Mistral

AI软件开发代理的基石

Devstral 的目标可不仅仅是生成代码,更重要的是能够集成到 OpenHands、SWE-Agent 和 OpenDevin 等代理框架中。有了这些框架,Devstral 就能与测试用例交互,导航源代码文件,以及跨项目执行多步骤任务。Rozière 透露,Devstral 将与 OpenDevin 一同发布,后者为代码代理提供了一个脚手架,充当开发者模型的后端。

为了确保模型的可靠性,Mistral 在不同的代码库和内部工作流程中对 Devstral 进行了严格的测试,以避免过度拟合 SWE-bench 基准。他们只使用来自非 SWE-bench 数据集的数据进行训练,并在不同的框架上验证了模型的性能。

部署简单,商业友好

Devstral 紧凑的 2400 万参数架构,使得开发者可以在本地轻松运行,无论是配备单个 RTX4090 GPU 的机器,还是拥有 32GB 内存的 Mac 电脑。这对于注重隐私保护和需要在边缘设备上部署的应用场景来说,简直是福音。Rozière 表示,该模型的目标用户包括热衷于本地和私有化操作的开发者和爱好者,他们甚至可以在没有互联网的环境中使用。

除了性能和可移植性之外,Devstral 的 Apache2.0 许可证也为商业应用提供了极大的便利。这个许可证允许无限制地使用、改编和分发,包括在专有产品中,这大大降低了企业采用的门槛。

Devstral 拥有 128,000 个 token 的上下文窗口,并使用包含 131,000 个词汇的铁拳分词器。它支持通过 Hugging Face、Ollama、Kaggle、LM Studio 和 Unsloth 等主流开源平台进行部署,并与 vLLM、Transformers 和 Mistral Inference 等库良好兼容。

API和本地部署,两条腿走路

开发者可以通过 Mistral 的 Le Platforme API 访问 Devstral,模型名称为 devstral-small-2505,定价为每百万输入 token 0.10 美元,每百万输出 token 0.30 美元。对于希望本地部署的用户来说,对 OpenHands 等框架的支持可以实现与代码库和代理工作流的即时集成。Rozière 分享了他自己如何使用 Devstral 来完成更新软件包版本或修改标记化脚本等小型开发任务,并对其在代码中精确定位和修改的能力表示赞赏。

虽然 Devstral 目前以研究预览版的形式发布,但 Mistral 和 All Hands AI 已经着手开发功能更强大、规模更大的后续模型。Rozière 认为,小型模型和大型模型之间的差距正在迅速缩小,而 Devstral 等模型的出色表现已经能够与一些规模更大的竞争对手相媲美。

总结

凭借其卓越的性能基准、宽松的开源许可和专为代理设计优化的特性,Devstral不仅是一款强大的代码生成工具,更将成为构建自主软件工程系统的关键基础模型。程序员们,赶紧用起来,解放双手,拥抱AI时代吧!

更多AI行业最新资讯新闻信息(ai界最新新闻)请关注AI人工智能网站--AITOP100平台--AI资讯

0
0
文章来源:AITOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • Luma AI Dream Machine“指令修改”来袭,视频创作要变天啦!

  • 通义万相国际版Wan2.2开源第2天:解锁场景布置新姿势

  • 告别繁琐!Genspark超级智能体与Outlook集成开启高效办公新姿势

  • 无需真机!如何用Google Maps和LTX Studio打造电影级无人机航拍大片

  • NotebookLM焕新登场:视频摘要功能震撼来袭!

热点资讯

豆包AI生图技术深度解析:引领中文图像生成新突破

5天前
豆包AI生图技术深度解析:引领中文图像生成新突破

阿里巴巴首款夸克AI眼镜惊艳亮相2025世界人工智能大会(WAIC)

4天前
阿里巴巴首款夸克AI眼镜惊艳亮相2025世界人工智能大会(WAIC)

YouTube Shorts大动作!AI特效来袭,照片秒变精彩视频

7天前
YouTube Shorts大动作!AI特效来袭,照片秒变精彩视频

Pika推出AI视频特效APP:自拍秒变创意大片,人人都是“导演”!

8天前
Pika推出AI视频特效APP:自拍秒变创意大片,人人都是“导演”!

创意加速!可灵AI"灵动画布"发布,多图参考功能迎来重大突破

2天前
创意加速!可灵AI"灵动画布"发布,多图参考功能迎来重大突破
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有