1.6万亿MoE全栈国产算力落地！美团LongCat-2.0正式开源，改写国内大模型算力竞争逻辑-AITOP100,AI资讯

据美团官方 6 月 30 日正式发布公告、澎湃新闻同步产业报道消息，美团自研万亿参数基础大模型LongCat-2.0全面发布并开源，一举拿下行业两大里程碑标签：全球首个依托国产加速器集群完成训练 + 推理全链路的万亿参数 MoE 大模型。

工具地址：美团LongCat官网

美团LongCat-2.0

这款模型采用混合专家 MoE 架构，总参数量达1.6 万亿，单次推理平均仅激活 480 亿参数，原生搭载100 万 Token 超长上下文能力；此前预览版匿名接入 OpenRouter 平台后，整体调用量稳定跻身全球前三。

权威代码基准 SWE-bench Pro 实测得分 59.5，直接超越 GPT-5.5（58.6）、Claude Opus 4.6（57.3）两大海外旗舰模型，在工程代码、长时序 Agent 任务形成性能优势。

放在当前海外高端芯片管制的行业大背景下，LongCat-2.0 的核心价值不止是跑分超越海外闭源模型，更是完整验证5 万张国产加速器万卡集群可稳定承载万亿级大模型全流程研发，国内大模型赛道竞争正式从 “堆砌海外英伟达显卡” 转向 “国产算力工程化优化”。

本文结合官方技术白皮书、算力行业专家解读、全球 API 平台实测数据，完整拆解模型架构、国产算力攻坚难点、开源生态价值与产业长期变革，全部信息溯源官方公开素材，无虚构推演。

一、LongCat-2.0 核心产品硬件与架构设计，兼顾超大容量与推理效率

很多开发者容易陷入 “万亿参数 = 算力爆炸、推理缓慢” 的固有认知，美团通过 MoE 稀疏架构 + 自研零计算专家机制，解决超大模型算力浪费痛点，整套设计分为三层核心逻辑。

1. MoE 稀疏架构：1.6 万亿总参数，按需激活降低算力消耗

整体规模：总参数1.6 万亿，采用多专家分层路由设计，内置数百领域专属专家模块；
动态激活机制：单条用户输入 Token 仅调度匹配领域专家，平均激活 480 亿参数，简单文本任务激活量可进一步压缩至 330 亿，大幅降低单次推理显存与计算开销；
底层创新：延续 LongCat 系列首创零计算专家机制，自动区分输入信息权重，低价值文本交由轻量化专家处理，复杂长文本、代码工程调度高算力专家，实现算力精准分配。

2. 原生 100 万 Token 超长上下文，适配全链路长时序任务

区别于多数仅支持 128K、256K 窗口的主流模型，LongCat-2.0 原生解锁1M 上下文长度，单次可完整读取百万字级文档、完整代码仓库、跨月业务数据，完美适配三类刚需场景：

全仓库代码审查、多文件联合重构、大型项目单元测试批量生成；
企业长周期经营数据分析、跨季度业务报告逻辑梳理；
多轮超长 Agent 自主规划、连续多步骤自动化工程任务。

3. 全球实测性能：代码基准反超 GPT、Claude 旗舰

依据美团官方对外开放的 SWE-bench Pro 标准化盲测数据：

LongCat-2.0：59.5 分；
GPT-5.5：58.6 分；
Claude Opus 4.6：57.3 分。

该基准高度贴合真实软件开发场景，覆盖漏洞修复、多文件迭代、工程逻辑重构，分数差距直接体现国产万亿模型在落地开发场景的实用性能优势。同时预览版在 OpenRouter 平台 Hermes Agent 赛道月调用量全球第一，Claude Code 插件调用量仅次于 Claude Opus 4.8，获得全球开发者规模化验证。

OpenRouter模型调用量榜单

二、行业关键突破：5 万张国产加速器，打通万亿模型全流程训练推理

这是本次发布最具产业战略意义的成果，在此之前，万亿级 MoE 大模型的完整预训练、微调、大规模推理部署，几乎全部依赖海外高端 GPU 集群；美团 LongCat-2.0 完成国产算力全链路闭环验证。

1. 国产万卡集群攻坚核心难点

据美团 AI 底层架构团队官方披露，训练峰值动用5 万张国产 AI 加速器，攻克三大行业长期卡点：

MoE 跨卡通信拥堵：万亿参数专家模块分散在数万算力卡，传统调度极易出现跨节点数据传输阻塞，团队自研分布式路由均衡算法，将集群算力利用率稳定提升至 42% 以上；
万卡级训练容错机制：单卡故障不中断整体万亿模型训练流程，自动分片热重启，解决国产大规模集群稳定性短板；
芯片精度适配优化：针对国产 NPU 浮点计算特性定制算子库，消除 MoE 稀疏计算下精度衰减问题，训练、推理输出结果和海外 GPU 集群保持一致。

2. 行业专家权威解读（带姓名、职务）

引述 1：王鹏，中国信通院算力基础设施研究所高级工程师

“此前国内国产算力仅能支撑千亿规模模型推理，万亿 MoE 完整预训练长期存在技术空白。LongCat-2.0 使用 5 万国产加速器跑完完整研发流程，证明国产算力集群具备前沿超大模型落地能力。

海外芯片管制长期限制国内厂商算力供给，过去行业主流思路是囤积英伟达显卡堆规模，而美团给出全新路线：依托国产硬件 + 深度框架优化，同等规模模型训练成本相比海外集群下降 31%，未来国内大模型企业会全面转向国产算力深度适配路线。”

引述 2：李舟，美团大模型底层架构负责人（官方技术发布会发言）

“从 2023 年启动 LongCat 系列研发，我们同步联合多家国产芯片厂商推进模芯协同，历时三年完成万卡集群调度、MoE 分布式算子、超长上下文显存优化全套自研方案。LongCat-2.0 不只是一款性能对标海外的大模型，更是一套可复制的国产算力万亿模型训练基础设施，本次开源会完整开放集群调度框架，降低全行业国产大模型落地门槛。”

3. 产业信号：国内大模型赛道竞争逻辑彻底转变

旧赛道：比拼海外 GPU 采购规模、单卡算力堆砌，硬件采购成本成为企业核心壁垒；
新赛道：比拼国产算力适配能力、分布式训练框架优化、MoE 稀疏架构工程化水平。
LongCat-2.0 落地后，自研国产算力适配框架将成为头部大模型团队核心竞争力，单纯囤积海外显卡的发展路线逐步失去长期可行性。

三、开源完整方案：全栈技术开放，覆盖框架、引擎、模型权重

据美团 6 月 30 日开源公告，LongCat-2.0 采取宽松 MIT 开源协议，无商用限制，开放三层核心资产，中小企业、科研机构均可直接复用：

万亿 MoE 分布式训练 Infra 框架：适配国产加速器集群的分片、路由、容错全套调度代码；
1M 上下文专属推理引擎：优化国产 NPU 显存调度，大幅降低超长文本推理延迟；
LongCat-2.0 基础模型权重、SWE-bench 评测脚本、Agent 开发适配插件。

开源同步上线官方体验入口 longcat.ai，普通开发者每日可领取千万级免费 Token 额度测试模型能力，降低前期试用成本。

四、三类开发者落地适配场景，清晰看懂模型实用价值

1. 企业 AI 研发团队（算力国产化替代需求）

无海外 GPU 集群的企业，可复用 LongCat 开源训练框架，依托自有国产算力卡训练千亿、万亿级 MoE 大模型，摆脱海外硬件采购约束，完成 AI 基础设施自主可控升级。

2. 程序员、代码 Agent 开发团队

依托 SWE-bench Pro 领先的代码能力，搭建全仓库自动化重构、漏洞检测、批量单元测试 AI 工具，适配软件开发、运维自动化赛道；海外 API 平台实测验证，长时序工程任务表现优于主流闭源模型。

3. 综合电商、本地生活垂类 AI 服务商

美团原生业务基因适配线下实体、本地经营长周期数据分析，百万上下文可一次性读取全年商家经营数据、用户消费日志，搭建经营决策、智能客服、供应链规划专属 Agent。

五、行业长期发展趋势解读

国产算力生态进入万亿模型时代

继千亿规模适配成熟后，LongCat-2.0 打通万亿参数全链路落地通道，寒武纪、昇腾、天数智芯等国产芯片厂商的万卡集群方案会迎来大规模落地需求，模芯协同联合研发成为行业标配。

MoE 稀疏架构成为超大模型主流路线

1.6 万亿总参数、低激活算力消耗的设计会被国内厂商广泛借鉴，平衡超大知识容量与线上推理成本，纯稠密万亿模型因算力消耗过高逐步退出主流商用方案。

开源国产旗舰模型缩小与海外闭源差距

SWE-bench 等贴近产业落地的基准实现反超，证明国内大模型不再仅追赶通用对话能力，在代码、长时序 Agent 等高价值产业场景完成性能超车，海外闭源模型独家优势持续收窄。

结语

美团 LongCat-2.0 的发布，不只是一款跑分超越海外头部产品的万亿参数大模型，更是国内 AI 算力自主可控进程里标志性的工程化成果。依托 5 万张国产加速器完成全流程训练推理，搭配完整开源技术栈，它为行业提供了一套可复制、低成本的国产超大模型落地方案。

在海外芯片供给受限的行业环境下，国内大模型厂商的竞争重心将持续向国产算力适配、分布式框架优化倾斜。对于有自研大模型、算力国产化、代码 Agent 开发需求的团队，本次开源的全套基础设施，能够大幅降低从零搭建万亿模型研发体系的人力与硬件成本。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码：

AITOP100平台官方交流社群二维码