• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

程序员福音!豆包大模型开源Multi-SWE-bench,专治代码Bug,还能测模型水平!

程序员福音!豆包大模型开源Multi-SWE-bench,专治代码Bug,还能测模型水平!
AI TOP100
2025-04-10 15:12:06

程序猿们,是不是每天都在和Bug战斗?好消息来了!

最近,字节跳动豆包大模型团队搞了个大事情,他们开源了一个叫Multi-SWE-bench的东西。这可不是个普通玩意儿,它是专门用来测试大模型“自动修Bug”能力的,而且还是多语言的!以后就能知道你的模型,除了会写Python,是不是也能搞定Java、C++了。

说实话,现在大模型发展太快了,代码生成能力也越来越重要。以前的SWE-bench虽然能测模型的编程能力,但只能测Python,太片面了!而且难度也不够,搞不定复杂的项目,限制了大模型的发展。

看看各家模型的成绩单

Multi-SWE-bench:不只是Python,七门语言全覆盖!

这次的Multi-SWE-bench就不一样了,它支持Java、TypeScript、C、C++、Go、Rust和JavaScript七种主流语言!总共有1632个真实的Bug修复任务,都是从开源项目里扒出来的,保证质量靠谱。更贴心的是,它还分了简单、中等、困难三个等级,能让你更清楚地知道模型在哪方面还不行。

实验结果也挺有意思,现在的大模型修Python的Bug还行,但换成其他语言,平均修复率竟然不到10%!看来多语言代码修复还是个大难题啊!

模型在不同语言上的表现差距很大,难度越大越拉胯

强化学习也能用上,还有开源社区等你来!

为了让强化学习也能用在自动编程上,他们还开源了Multi-SWE-RL,提供了4723个例子,还有配套的Docker环境,方便你一键启动、自动评估。简直是为RL训练量身定做!

更棒的是,他们还搞了个开源社区,欢迎各位开发者和研究者一起参与,扩展数据集、测试新方法,共同打造RL for Code的生态。以后大家一起修Bug,想想就刺激!

总结:自动编程的未来,等你来参与!

豆包大模型团队说了,他们希望Multi-SWE-bench能推动自动编程技术更上一层楼,以后还会继续扩大覆盖范围,帮助大模型在“自动化软件工程”领域取得更大的突破。所以,各位程序猿们,赶紧用起来,一起为自动编程的未来添砖加瓦吧!

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

豆包网页版

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 豆包MarsCode
  • 豆包AI官网
相关资讯
  • 国际数据公司(IDC)最新发布:2029年全球AI投资或将突破1.2万亿美元

  • 通义万相2.5城市地标3D动画制作教程:11个中国城市微缩视频Prompt完整版

  • 2025年9月25日重磅!Vidu Q2图生视频大模型上线,AI演戏表情细节拉满,创作者狂喜!

  • 炉米Lumi正式上线:支持豆包、即梦等模型Lora微调,视觉定制成本降60%

  • Wan2.5 Preview正式上线:AI生成电影级视频+“听懂”人话的多模态神器来了

热点资讯

字节跳动豆包翻译大模型上线:28种语言秒译,性能碾压GPT-4o,价格直接打“骨折”?

4天前
字节跳动豆包翻译大模型上线:28种语言秒译,性能碾压GPT-4o,价格直接打“骨折”?

阿里夸克重磅推出AI创作平台“造点”:AI生图+视频生成全免费,Midjourney V7+通义万相Wan2.5双引擎加持

3天前
阿里夸克重磅推出AI创作平台“造点”:AI生图+视频生成全免费,Midjourney V7+通义万相Wan2.5双引擎加持

Wan2.5 Preview正式上线:AI生成电影级视频+“听懂”人话的多模态神器来了

2天前
Wan2.5 Preview正式上线:AI生成电影级视频+“听懂”人话的多模态神器来了

2025年9月25日重磅:Meta上线320亿参数代码模型CWM,AI写代码竟能"先试后做"?

1天前
2025年9月25日重磅:Meta上线320亿参数代码模型CWM,AI写代码竟能"先试后做"?

重磅升级!阿里Qwen-Image-Edit-2509多图像编辑神器,一键生成广告大片不是梦

4天前
重磅升级!阿里Qwen-Image-Edit-2509多图像编辑神器,一键生成广告大片不是梦
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有