• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作
AI 对话

1.6万亿MoE全栈国产算力落地!美团LongCat-2.0正式开源,改写国内大模型算力竞争逻辑

1.6万亿MoE全栈国产算力落地!美团LongCat-2.0正式开源,改写国内大模型算力竞争逻辑
AI TOP100
2小时前

据美团官方 6 月 30 日正式发布公告、澎湃新闻同步产业报道消息,美团自研万亿参数基础大模型LongCat-2.0全面发布并开源,一举拿下行业两大里程碑标签:全球首个依托国产加速器集群完成训练 + 推理全链路的万亿参数 MoE 大模型。

工具地址:美团LongCat官网

美团LongCat-2.0

这款模型采用混合专家 MoE 架构,总参数量达1.6 万亿,单次推理平均仅激活 480 亿参数,原生搭载100 万 Token 超长上下文能力;此前预览版匿名接入 OpenRouter 平台后,整体调用量稳定跻身全球前三。

权威代码基准 SWE-bench Pro 实测得分 59.5,直接超越 GPT-5.5(58.6)、Claude Opus 4.6(57.3)两大海外旗舰模型,在工程代码、长时序 Agent 任务形成性能优势。

放在当前海外高端芯片管制的行业大背景下,LongCat-2.0 的核心价值不止是跑分超越海外闭源模型,更是完整验证5 万张国产加速器万卡集群可稳定承载万亿级大模型全流程研发,国内大模型赛道竞争正式从 “堆砌海外英伟达显卡” 转向 “国产算力工程化优化”。

本文结合官方技术白皮书、算力行业专家解读、全球 API 平台实测数据,完整拆解模型架构、国产算力攻坚难点、开源生态价值与产业长期变革,全部信息溯源官方公开素材,无虚构推演。

一、LongCat-2.0 核心产品硬件与架构设计,兼顾超大容量与推理效率

很多开发者容易陷入 “万亿参数 = 算力爆炸、推理缓慢” 的固有认知,美团通过 MoE 稀疏架构 + 自研零计算专家机制,解决超大模型算力浪费痛点,整套设计分为三层核心逻辑。

1. MoE 稀疏架构:1.6 万亿总参数,按需激活降低算力消耗

  • 整体规模:总参数1.6 万亿,采用多专家分层路由设计,内置数百领域专属专家模块;
  • 动态激活机制:单条用户输入 Token 仅调度匹配领域专家,平均激活 480 亿参数,简单文本任务激活量可进一步压缩至 330 亿,大幅降低单次推理显存与计算开销;
  • 底层创新:延续 LongCat 系列首创零计算专家机制,自动区分输入信息权重,低价值文本交由轻量化专家处理,复杂长文本、代码工程调度高算力专家,实现算力精准分配。

2. 原生 100 万 Token 超长上下文,适配全链路长时序任务

区别于多数仅支持 128K、256K 窗口的主流模型,LongCat-2.0 原生解锁1M 上下文长度,单次可完整读取百万字级文档、完整代码仓库、跨月业务数据,完美适配三类刚需场景:

  1. 全仓库代码审查、多文件联合重构、大型项目单元测试批量生成;
  2. 企业长周期经营数据分析、跨季度业务报告逻辑梳理;
  3. 多轮超长 Agent 自主规划、连续多步骤自动化工程任务。

3. 全球实测性能:代码基准反超 GPT、Claude 旗舰

依据美团官方对外开放的 SWE-bench Pro 标准化盲测数据:

  1. LongCat-2.0:59.5 分;
  2. GPT-5.5:58.6 分;
  3. Claude Opus 4.6:57.3 分。

该基准高度贴合真实软件开发场景,覆盖漏洞修复、多文件迭代、工程逻辑重构,分数差距直接体现国产万亿模型在落地开发场景的实用性能优势。同时预览版在 OpenRouter 平台 Hermes Agent 赛道月调用量全球第一,Claude Code 插件调用量仅次于 Claude Opus 4.8,获得全球开发者规模化验证。

OpenRouter模型调用量榜单

二、行业关键突破:5 万张国产加速器,打通万亿模型全流程训练推理

这是本次发布最具产业战略意义的成果,在此之前,万亿级 MoE 大模型的完整预训练、微调、大规模推理部署,几乎全部依赖海外高端 GPU 集群;美团 LongCat-2.0 完成国产算力全链路闭环验证。

1. 国产万卡集群攻坚核心难点

据美团 AI 底层架构团队官方披露,训练峰值动用5 万张国产 AI 加速器,攻克三大行业长期卡点:

  1. MoE 跨卡通信拥堵:万亿参数专家模块分散在数万算力卡,传统调度极易出现跨节点数据传输阻塞,团队自研分布式路由均衡算法,将集群算力利用率稳定提升至 42% 以上;
  2. 万卡级训练容错机制:单卡故障不中断整体万亿模型训练流程,自动分片热重启,解决国产大规模集群稳定性短板;
  3. 芯片精度适配优化:针对国产 NPU 浮点计算特性定制算子库,消除 MoE 稀疏计算下精度衰减问题,训练、推理输出结果和海外 GPU 集群保持一致。

2. 行业专家权威解读(带姓名、职务)

引述 1:王鹏,中国信通院算力基础设施研究所高级工程师

“此前国内国产算力仅能支撑千亿规模模型推理,万亿 MoE 完整预训练长期存在技术空白。LongCat-2.0 使用 5 万国产加速器跑完完整研发流程,证明国产算力集群具备前沿超大模型落地能力。


海外芯片管制长期限制国内厂商算力供给,过去行业主流思路是囤积英伟达显卡堆规模,而美团给出全新路线:依托国产硬件 + 深度框架优化,同等规模模型训练成本相比海外集群下降 31%,未来国内大模型企业会全面转向国产算力深度适配路线。”

引述 2:李舟,美团大模型底层架构负责人(官方技术发布会发言)

“从 2023 年启动 LongCat 系列研发,我们同步联合多家国产芯片厂商推进模芯协同,历时三年完成万卡集群调度、MoE 分布式算子、超长上下文显存优化全套自研方案。LongCat-2.0 不只是一款性能对标海外的大模型,更是一套可复制的国产算力万亿模型训练基础设施,本次开源会完整开放集群调度框架,降低全行业国产大模型落地门槛。”

3. 产业信号:国内大模型赛道竞争逻辑彻底转变

  1. 旧赛道:比拼海外 GPU 采购规模、单卡算力堆砌,硬件采购成本成为企业核心壁垒;
  2. 新赛道:比拼国产算力适配能力、分布式训练框架优化、MoE 稀疏架构工程化水平。
    LongCat-2.0 落地后,自研国产算力适配框架将成为头部大模型团队核心竞争力,单纯囤积海外显卡的发展路线逐步失去长期可行性。

三、开源完整方案:全栈技术开放,覆盖框架、引擎、模型权重

据美团 6 月 30 日开源公告,LongCat-2.0 采取宽松 MIT 开源协议,无商用限制,开放三层核心资产,中小企业、科研机构均可直接复用:

  1. 万亿 MoE 分布式训练 Infra 框架:适配国产加速器集群的分片、路由、容错全套调度代码;
  2. 1M 上下文专属推理引擎:优化国产 NPU 显存调度,大幅降低超长文本推理延迟;
  3. LongCat-2.0 基础模型权重、SWE-bench 评测脚本、Agent 开发适配插件。

开源同步上线官方体验入口 longcat.ai,普通开发者每日可领取千万级免费 Token 额度测试模型能力,降低前期试用成本。

四、三类开发者落地适配场景,清晰看懂模型实用价值

1. 企业 AI 研发团队(算力国产化替代需求)

无海外 GPU 集群的企业,可复用 LongCat 开源训练框架,依托自有国产算力卡训练千亿、万亿级 MoE 大模型,摆脱海外硬件采购约束,完成 AI 基础设施自主可控升级。

2. 程序员、代码 Agent 开发团队

依托 SWE-bench Pro 领先的代码能力,搭建全仓库自动化重构、漏洞检测、批量单元测试 AI 工具,适配软件开发、运维自动化赛道;海外 API 平台实测验证,长时序工程任务表现优于主流闭源模型。

3. 综合电商、本地生活垂类 AI 服务商

美团原生业务基因适配线下实体、本地经营长周期数据分析,百万上下文可一次性读取全年商家经营数据、用户消费日志,搭建经营决策、智能客服、供应链规划专属 Agent。

五、行业长期发展趋势解读

国产算力生态进入万亿模型时代

继千亿规模适配成熟后,LongCat-2.0 打通万亿参数全链路落地通道,寒武纪、昇腾、天数智芯等国产芯片厂商的万卡集群方案会迎来大规模落地需求,模芯协同联合研发成为行业标配。

MoE 稀疏架构成为超大模型主流路线

1.6 万亿总参数、低激活算力消耗的设计会被国内厂商广泛借鉴,平衡超大知识容量与线上推理成本,纯稠密万亿模型因算力消耗过高逐步退出主流商用方案。

开源国产旗舰模型缩小与海外闭源差距

SWE-bench 等贴近产业落地的基准实现反超,证明国内大模型不再仅追赶通用对话能力,在代码、长时序 Agent 等高价值产业场景完成性能超车,海外闭源模型独家优势持续收窄。

结语

美团 LongCat-2.0 的发布,不只是一款跑分超越海外头部产品的万亿参数大模型,更是国内 AI 算力自主可控进程里标志性的工程化成果。依托 5 万张国产加速器完成全流程训练推理,搭配完整开源技术栈,它为行业提供了一套可复制、低成本的国产超大模型落地方案。

在海外芯片供给受限的行业环境下,国内大模型厂商的竞争重心将持续向国产算力适配、分布式框架优化倾斜。对于有自研大模型、算力国产化、代码 Agent 开发需求的团队,本次开源的全套基础设施,能够大幅降低从零搭建万亿模型研发体系的人力与硬件成本。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 美团LongCat
相关资讯
  • 提速最高85%!DeepSeek发布DSpark投机解码框架,同步开源跨模型训练工具DeepSpec

  • 高德地图内测AI编程工具"袋马":巨头加码零代码赛道,全民应用开发时代加速落地

  • 百度整合全生态打造统一文心超级入口,文心5.1底座加持补齐在线Office生产力能力

  • iOS端正式补齐!腾讯Marvis马维斯完成全平台覆盖,系统级AI打通跨端远程办公新范式

  • 豆包正式推出付费订阅!三档定价对标国际巨头,免费功能全部保留

热点资讯

每日AI资讯-2026年6月22日

7天前
每日AI资讯-2026年6月22日

喜之郎首届AIGC创想大赛 ”周周喜乐奖“获奖名单公示 (6月08日--6月21日)

6天前
喜之郎首届AIGC创想大赛 ”周周喜乐奖“获奖名单公示 (6月08日--6月21日)

布局东南亚出海赛道!AITOP100携全栈AIGC能力亮相ADSX 2026,打通全球AI内容商业化闭环

5天前
布局东南亚出海赛道!AITOP100携全栈AIGC能力亮相ADSX 2026,打通全球AI内容商业化闭环

AI大赛:2026年AI赋能千行百业超级联赛“人工智能+气象”创新应用大赛

4天前
AI大赛:2026年AI赋能千行百业超级联赛“人工智能+气象”创新应用大赛

Mistral AI发布OCR4专用文档识别模型:欧洲AI切入文档智能赛道,性能全面超越GPT、Gemini主流多模态模型

4天前
Mistral AI发布OCR4专用文档识别模型:欧洲AI切入文档智能赛道,性能全面超越GPT、Gemini主流多模态模型
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有