• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

月之暗面放大招!首款自主智能体Kimi-Researcher登场

月之暗面放大招!首款自主智能体Kimi-Researcher登场
AI TOP100
2025-06-23 11:37:16

在AI智能体(Agent)竞争愈发激烈的当下,月之暗面(Moonshot AI)今日重磅推出其备受瞩目的Kimi研究功能,正式加入这场“智能大战”。据说,该功能在多项基准测试里表现亮眼,尤其是在名为“人类终极考验”(Humanity's Last Exam,HLE)的测试中,直接超越谷歌和 OpenAI 的同类产品,一举拿下冠军宝座。

Kimi-Researcher

Kimi-Researcher:多轮搜索与推理的“高手”

Kimi研究功能的核心是Kimi-Researcher,这可是个擅长多轮搜索与推理的自主智能体。官方数据显示,在执行每个任务时,它平均会进行23个推理步骤,还会浏览超过200个网址,这强大的信息处理和分析能力,着实让人惊叹。

基准测试表现:HLE 登顶,实力超群

Kimi-Researcher是基于Kimi k-系列模型的内部版本构建的,并且完全通过 端到端的智能体强化学习(RL) 进行训练。在“人类终极考验”(HLE)测试中,它取得了 26.9% 的 Pass@1 得分率,达到了业界顶尖水平;Pass@4 准确率更是高达 40.17%。

值得一提的是,Kimi-Researcher的HLE初始得分仅为 8.6%,最终能达到 26.9% 的高分,几乎全是端到端强化学习训练的功劳。月之暗面表示,这充分证明了端到端智能体强化学习能极大地提升智能体的智能水平。

此外,Kimi-Researcher在多个复杂且具挑战性的真实世界基准测试中也表现出色。在xbench测试(一套全新的、动态的、与专业需求对齐的测试套件)的xbench-DeepSearch项目上,Kimi-Researcher取得了 69% 的 Pass@1(4 次运行平均值),表现比配备了搜索工具的 o3 等模型还要好。在针对多轮搜索推理(如 FRAMES、Seal-0)和事实性信息问答(如 SimpleQA)的基准测试中,它同样成绩优异。

开源计划与内测申请:福利来袭

月之暗面宣布,Kimi-Researcher将从今日起逐步向用户开放。现在,用户可以访问kimi官网申请内测,提前体验这款强大的智能体。更让人兴奋的是,未来几个月内,月之暗面将开源 Kimi-Researcher 背后的基础预训练模型以及经过强化学习训练后的模型,这无疑将为 AI 社区的发展做出重要贡献。

Kimi-Researcher

Kimi-Researcher 的推出,为AI智能体领域注入了新的活力。

未来,它或许会在更多场景中发挥作用,让我们拭目以待。

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • Kimi ai:人工智能助手
相关资讯
  • 2025年8月第2周-12家AI工具精选:AITOP100收录的全场景效率神器(附免费试用入口)

  • 2025年8月上旬AI大赛合集:7场赛事总奖金40.83万,速看参赛指南!

  • 百度放大招!新推理模型与文心一言5.0即将上线

  • MiniMax Speech 2.5上线:多语种语音生成迎来“天花板”级突破

  • 手机也能跑GPT-4V!面壁智能MiniCPM-V4.0开源,性能碾压一众对手!

热点资讯

重磅!微软Bing Search API确认8月11日停服,全球数十万开发者面临迁移危机

4天前
重磅!微软Bing Search API确认8月11日停服,全球数十万开发者面临迁移危机

AITOP100 AI应用重磅更新!即梦AI 3.0、Vidu Q1、海螺AI全新升级

5天前
AITOP100 AI应用重磅更新!即梦AI 3.0、Vidu Q1、海螺AI全新升级

马斯克xAI放大招:Grok 4永久免费!AI界"白嫖"时代来了?

5小时前
马斯克xAI放大招:Grok 4永久免费!AI界"白嫖"时代来了?

Higgsfield AI新功能上线:高级别多参考功能,让创作更省心

7天前
Higgsfield AI新功能上线:高级别多参考功能,让创作更省心

百度放大招!新推理模型与文心一言5.0即将上线

3天前
百度放大招!新推理模型与文心一言5.0即将上线
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有