• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

月之暗面放大招!Kimi-Dev-72B开源模型打破编程基准记录

月之暗面放大招!Kimi-Dev-72B开源模型打破编程基准记录
AI TOP100
2025-06-17 16:46:39

家人们,科技圈又有大新闻啦!月之暗面(Moonshot AI)最近推出了全新的开源模型——Kimi-Dev-72B,这个模型一登场,就在软件工程领域掀起了一阵风暴,还在AI编程基准测试SWE-bench Verified中创下了全球最高的开源模型成绩,直接成了开源模型里的新标杆!

Kimi-Dev-72B

小参数大能量,超越“巨无霸”对手

Kimi-Dev-72B的设计参数只有72亿,可别小看这数字,它成功超越了刚发布不久的DeepSeek-R1,要知道DeepSeek-R1的参数量可是高达671亿呢!这就好比一个身材小巧的运动员,却能在赛场上打败身材魁梧的对手,实力不容小觑。

在SWE-bench Verified测试中,Kimi-Dev-72B拿到了60.4%的高分。这个测试可不简单,它就像一场严格的考试,只有所有测试用例都通过了,模型才能获得奖励。这就保证了Kimi-Dev-72B生成的解决方案既正确又稳健,完全符合现实开发的高标准。

开放下载,资源丰富等你来拿

现在,Kimi-Dev-72B已经在Hugging Face和GitHub平台上开放下载啦!用户可以轻松获取模型权重和源代码,技术报告也即将发布。要是你想体验一下这个厉害的模型,赶紧去这两个平台看看吧。

Hugging Face链接:huggingface.co/moonshotai/Kimi-Dev-72B

GitHub链接:github.com/MoonshotAI/Kimi-Dev

双重角色,工作流程简单高效

在设计理念上,Kimi-Dev-72B就像一个全能选手,结合了BugFixer和TestWriter的双重角色。BugFixer负责修复代码里的错误,就像一个细心的医生,把代码里的“毛病”一个个找出来并治好;TestWriter则编写相应的单元测试,确保代码的质量和稳定性。这两个部分相互配合,让模型在编程任务中更加有效。

Kimi-Dev-72B的工作流程也很简单明了,主要分为文件本地化和代码编辑两个阶段。就像盖房子一样,先打好地基(文件本地化),再进行装修(代码编辑),一步一步地把任务完成。

高质量数据训练,强化学习提升能力

为了增强模型的能力,月之暗面可是下了大功夫。他们使用了约1500亿个高质量数据进行中期训练,这些数据都来自GitHub的真实问题和PR提交。而且,他们还对数据进行了严格的净化,让模型能够学习到人类开发者是如何解决问题和编写代码的。

在强化学习阶段,重点提升模型的代码编辑能力。通过基于结果的奖励系统,就像给模型设立了一个个小目标,完成目标就能获得奖励,从而逐步优化模型的表现。

Kimi-Dev-72B

自我博弈,提升性能和效果

在测试环节,Kimi-Dev-72B能够协调BugFixer和TestWriter的角色,采用自我博弈机制。这就好比两个高手在对决,互相切磋,从而提升自己的实力。每个问题最多可以生成40个补丁候选和测试候选,显示了自博弈机制的强大效应。

未来发展,深度集成更便捷

未来,月之暗面计划进一步扩展Kimi-Dev-72B的功能,探索与流行开发工具的深度集成,让它能更无缝地融入开发者的工作流程。公司还承诺会持续改进这个模型,进行严谨的红队测试,以便向社区推出更强大的版本。

家人们,让我们一起期待Kimi-Dev-72B在未来能给我们带来更多的惊喜吧!

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • Kimi ai:人工智能助手
相关资讯
  • 2025年8月第2周-12家AI工具精选:AITOP100收录的全场景效率神器(附免费试用入口)

  • 2025年8月上旬AI大赛合集:7场赛事总奖金40.83万,速看参赛指南!

  • 百度放大招!新推理模型与文心一言5.0即将上线

  • MiniMax Speech 2.5上线:多语种语音生成迎来“天花板”级突破

  • 手机也能跑GPT-4V!面壁智能MiniCPM-V4.0开源,性能碾压一众对手!

热点资讯

重磅!微软Bing Search API确认8月11日停服,全球数十万开发者面临迁移危机

4天前
重磅!微软Bing Search API确认8月11日停服,全球数十万开发者面临迁移危机

AITOP100 AI应用重磅更新!即梦AI 3.0、Vidu Q1、海螺AI全新升级

5天前
AITOP100 AI应用重磅更新!即梦AI 3.0、Vidu Q1、海螺AI全新升级

马斯克xAI放大招:Grok 4永久免费!AI界"白嫖"时代来了?

5小时前
马斯克xAI放大招:Grok 4永久免费!AI界"白嫖"时代来了?

Higgsfield AI新功能上线:高级别多参考功能,让创作更省心

7天前
Higgsfield AI新功能上线:高级别多参考功能,让创作更省心

百度放大招!新推理模型与文心一言5.0即将上线

3天前
百度放大招!新推理模型与文心一言5.0即将上线
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有