美团LongCat团队发布全新开源AI模型,引领开源社区新潮流
今日,美团旗下的 LongCat 团队正式宣布推出并开源其最新力作——LongCat-Flash-Thinking-2601。作为 LongCat-Flash-Thinking 系列的升级版本,这一模型在智能体搜索、工具调用以及推理能力等多个核心评测基准上,均达到了当前开源模型的顶尖水平(SOTA),无疑为开源社区注入了一股强劲的新动力。

卓越工具调用能力,降低新工具适配成本
LongCat-Flash-Thinking-2601 的核心亮点在于其出色的工具调用能力。在面对依赖工具的复杂任务时,该模型展现出了非凡的适应性和灵活性,能够迅速理解并调用合适的工具完成任务。
这一特性不仅显著提升了模型在真实场景中的应用价值,还大幅降低了对新工具进行适配训练的成本,为开发者提供了更为便捷、高效的开发体验。
“重思考模式”首次开源,模拟人类深思熟虑过程
值得一提的是,LongCat-Flash-Thinking-2601还首次以开源形式提供了“重思考模式”的在线免费体验。用户只需访问longcat网站,即可亲身感受这一创新模式的魅力。
在该模式下,模型模拟了人类深思熟虑的过程,将思考分为并行思考和总结归纳两个阶段。这种分阶段的思考方式确保了思维的全面性和决策的可靠性,为用户提供了更为精准、可靠的推理结果。
多项评测指标优异,编程数学推理能力突出
经过严格的评估和测试,LongCat-Flash-Thinking-2601在编程、数学推理、智能体工具调用及搜索能力等多个方面均表现卓越。在编程能力方面,该模型在LCB评测中获得了高达82.8分的优异成绩,位居同类模型前列;在数学推理方面,该模型在 AIME-25 评测中更是斩获满分 100 分,进一步巩固了其在该领域的领先地位。

创新评测方法验证泛化能力,随机任务表现领先
为了全面评估模型的泛化能力,LongCat 团队还提出了一种全新的评测方法。该方法利用自动化任务合成流程,支持用户基于关键词随机生成复杂任务,并评估模型在此类环境中的表现。实验结果表明,LongCat-Flash-Thinking-2601在多项随机生成的任务中均保持了领先的表现,充分证明了其强大的泛化能力和适应性。
独特训练策略与数据增强,提升复杂场景适应能力
在训练过程中,LongCat 团队采用了“环境扩展 + 多环境强化学习”的独特策略,为模型提供了多样化的高强度训练环境。这种训练方式显著提升了模型在复杂场景下的适应能力,使其能够更好地应对各种挑战。
此外,团队还对训练数据进行了噪声注入处理,以增强模型的稳健性。这一举措使得模型在面对 API 调用失败或数据缺失等复杂情况时,仍能高效完成任务,展现了其强大的容错能力和鲁棒性。
开放资源降低开发门槛,鼓励开发者积极参与
为了降低开发者的使用门槛,促进开源社区的繁荣发展,美团LongCat团队同时开放了模型的权重、推理代码及在线体验能力。开发者可以通过GitHub、Hugging Face和ModelScope等平台轻松获取这些资源,并在longcat.ai网站上进行在线体验。
这一举措无疑为开发者提供了更为便捷、高效的开发工具和环境,鼓励他们积极参与这一开源项目,共同推动 AI 技术的发展和进步。
官网地址:美团Longcat网页版官网
结语:开源共享,共筑 AI 未来
美团LongCat-Flash-Thinking-2601的发布和开源,不仅展示了美团在AI领域的深厚实力和创新能力,更为开源社区带来了新的活力和机遇。
我们期待更多开发者能够加入到这一开源项目中来,共同探索 AI 技术的无限可能,携手共筑AI的美好未来。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










