2026年6月1日,MiniMax稀宇科技正式发布新一代旗舰大模型MiniMax M3,直接打出「前沿Coding能力+1M超长上下文+原生多模态」三大硬核能力组合拳,成为国内首个集齐这三大顶级特性、同时也是全球唯一开源实现该水准的通用大模型。
这不仅是一次参数与性能的升级,更是从底层注意力架构、训练范式到Agent协作逻辑的全面重构。本文用最硬核、最直白的方式,把M3的技术突破、实测表现、定价与生态一次性讲透。
工具地址:Minimax官网
一、核心定位:三项能力合一,国产开源首次摸到Frontier门槛
MiniMax M3的官方定位非常清晰:
- 具备闭源前沿模型级别的Coding与智能体能力
- 支持最高1M token超长上下文
- 采用原生多模态训练,支持图像、视频输入与桌面操作
官方明确强调:这三项是当前海外头部闭源模型的"标配能力",而M3是国内第一个齐备、且唯一开源的模型。
简单说:以前开源模型要么长上下文不行、要么代码拉胯、要么多模态后加。现在M3第一次做到三项全能、全部拉满。

二、底层架构革命:MSA稀疏注意力,1M上下文计算量仅1/20
M3最核心的技术底牌,是全新自研的MSA(MiniMax Sparse Attention)稀疏注意力架构,从根上解决长上下文"越跑越慢、越跑越贵"的死穴。
1. 传统架构的致命问题
标准Transformer注意力是O(n²)复杂度,序列越长,计算量爆炸式增长。100万token场景下,几乎无法商用推理。
2. MSA的三大技术突破
第一,精准KV分块。 相比DSA、MoBA等稀疏方案,MSA能更精细地对键值对分块,有效上下文覆盖率更高,长文本信息不丢失。
第二,算子层深度优化。 采用KV outer gather聚合机制,每块只读一次、访存连续,计算访存比大幅优于主流方案,速度比Flash-Sparse-Attention、FlashMoBA快4倍以上。
第三,线性复杂度落地。 在1M上下文下:
- 每token计算量仅为上代模型的1/20
- Prefilling阶段加速超9倍
- Decoding阶段加速超15倍
- 绝大部分能力与全注意力基本持平
一句话总结:别人跑1M上下文卡成PPT,M3跑得又快又便宜,还不丢信息。

三、Coding与Agent能力:SWE-Bench Pro超GPT-5.5,接近Opus 4.7
M3在代码与智能体方向直接对标国际一线,多项权威Benchmark打出高分,我们只看官方实测、可复现的硬数据:
SWE-Bench Pro(真实软件工程):MiniMax M3得分59.0%,超GPT-5.5、Gemini 3.1 Pro,接近Opus 4.7。
Terminal Bench 2.1(终端命令执行):MiniMax M3得分66.0%,接近GPT-5.5、Gemini 3.1 Pro。
SVG-Bench(矢量图代码生成):MiniMax M3得分63.7%,超过Opus 4.7。
KernelBench Hard(底层内核生成):MiniMax M3得分28.8%,硬核底层开发能力拉满。
Claw-Eval(自主Agent端到端):MiniMax M3拿下最高分,自主调度、任务闭环业界第一。
MCP Atlas(多工具协同):MiniMax M3得分74.2%,接近Opus 4.7。
BrowseComp(浏览信息整合):MiniMax M3得分83.5%,业界领先水平。

为什么M3代码这么强?
官方没有堆Benchmark,而是从真实协作场景下手:
- 构建交互式用户模拟器框架,模拟需求澄清、方案讨论、多轮迭代、任务切换
- 让模型在训练阶段就进入真实工程协作环境,而不是单轮指令执行
- 目标不是"能跑的代码",而是可直接交付、可长期维护的生产级代码
这也是M3在SWE-Bench Pro这种高难度、抗污染的真实场景里能打赢GPT-5.5的关键原因。
四、原生多模态:从Step 0混合训练,支持图/视频/桌面操作
M3不是"文本模型+多模态插件",而是从头到尾原生多模态:
- 从预训练第一步就做文本+图像+视频交错训练
- 不同模态共享统一语义空间,理解更准、对齐更强
- 支持图片输入、视频输入、电脑桌面操作(Computer Use)
- 训练数据管线全面重构,Token规模扩至100万亿量级
实际表现非常恐怖:
- 看懂论文里的图表、公式、曲线
- 直接复现顶会论文实验
- 操作桌面软件、跨应用执行复杂任务
这也是M3能完成12小时无人干预复现ICLR顶会论文、24小时自主优化CUDA内核到71.3%利用率的基础。
五、三大实测名场面:真正的长程Agent实力
MiniMax官方放出了三个极具说服力的真实任务,全部无人工干预:
1. 顶会论文全自动复现
- 任务:复现ICLR 2025杰出论文《Learning Dynamics of LLM Finetuning》
- 过程:近12小时自主运行
- 产出:18次commit、23张实验图表
- 结果:复现SFT概率变化、DPO squeezing效应、验证Extend方法,完全复现论文结论

2. CUDA算子自主优化(Hopper FP8 GEMM)
- 起点:仅任务描述+基准脚本+无法运行的Triton骨架
- 过程:24小时、147次benchmark、1959次工具调用,无人工介入
- 结果:硬件利用率从7.6% → 71.3%,速度提升9.4倍,达到生产级标准

3. 全自动"训模型"
- 任务:4个Base模型,12小时内完成数据合成→训练→评测→迭代全流程
- 场景:数学推理、工具调用、科学知识、代码生成
- 结果:得分0.37,略低于Opus 4.7(0.42)、GPT-5.5(0.39),大幅领先其他模型

六、配套产品:MiniMax Code + Token Plan,开箱即用
M3不是孤立模型,配套体系一步到位:
1. MiniMax Code:M3专属智能体
- 支持大型任务拆解、多Agent并发、动态Workflow
- 可自主运行数天,持续反思与纠错
- 支持Computer Use,语音指令操控桌面软件、跨系统操作
- 计划后续开源,回馈社区
2. Token Plan:价格打到地板
三档订阅,同价位用量远超海外竞品:
- Plus 49元/月:6亿token
- Max 119元/月:18亿token
- Ultra 469元/月:55亿token
官方对比:同价格下,用量约为Claude订阅的15倍,个人开发者狂喜。
3. API开放:限时5折
- 支持≤512k与1M两档上下文
- 支持thinking/non-thinking双模式
- 上线限时7天5折,用M2的价格玩M3
- 10天内将发布技术报告+开源权重

七、行业意义:开源模型第一次正面硬刚闭源天花板
MiniMax M3的发布,标志着几个关键拐点:
- 国产开源大模型正式进入Frontier区间,代码、长上下文、多模态全面看齐GPT-5.5、Claude Opus、Gemini 3.1 Pro
- 稀疏注意力从论文走向量产,MSA证明长上下文可以低成本、高效率、高精度落地
- Agent不再是概念,长程自主迭代、无人干预完成科研/工程任务成为现实
- 开源生态开始反向定义技术路线,闭源不再是唯一选择
结语
MiniMax M3用一套非常扎实的技术组合,告诉整个行业:开源模型也能拥有闭源顶级能力。
1M上下文、原生多模态、Frontier级Coding,三项全能、全部开源,再加上极具杀伤力的定价,M3很可能成为2026年开发者、企业级应用的标配底座模型。
技术没有捷径,MiniMax这次用底层创新,真正走到了前沿。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










