MiniMax M3正式发布：1M上下文+原生多模态+顶级Coding，开源对标闭源天花板-AITOP100,AI资讯

2026年6月1日，MiniMax稀宇科技正式发布新一代旗舰大模型MiniMax M3，直接打出「前沿Coding能力+1M超长上下文+原生多模态」三大硬核能力组合拳，成为国内首个集齐这三大顶级特性、同时也是全球唯一开源实现该水准的通用大模型。

这不仅是一次参数与性能的升级，更是从底层注意力架构、训练范式到Agent协作逻辑的全面重构。本文用最硬核、最直白的方式，把M3的技术突破、实测表现、定价与生态一次性讲透。

工具地址：Minimax官网

一、核心定位：三项能力合一，国产开源首次摸到Frontier门槛

MiniMax M3的官方定位非常清晰：

具备闭源前沿模型级别的Coding与智能体能力
支持最高1M token超长上下文
采用原生多模态训练，支持图像、视频输入与桌面操作

官方明确强调：这三项是当前海外头部闭源模型的"标配能力"，而M3是国内第一个齐备、且唯一开源的模型。

简单说：以前开源模型要么长上下文不行、要么代码拉胯、要么多模态后加。现在M3第一次做到三项全能、全部拉满。

MiniMax M3

二、底层架构革命：MSA稀疏注意力，1M上下文计算量仅1/20

M3最核心的技术底牌，是全新自研的MSA（MiniMax Sparse Attention）稀疏注意力架构，从根上解决长上下文"越跑越慢、越跑越贵"的死穴。

1. 传统架构的致命问题

标准Transformer注意力是O(n²)复杂度，序列越长，计算量爆炸式增长。100万token场景下，几乎无法商用推理。

2. MSA的三大技术突破

第一，精准KV分块。 相比DSA、MoBA等稀疏方案，MSA能更精细地对键值对分块，有效上下文覆盖率更高，长文本信息不丢失。

第二，算子层深度优化。 采用KV outer gather聚合机制，每块只读一次、访存连续，计算访存比大幅优于主流方案，速度比Flash-Sparse-Attention、FlashMoBA快4倍以上。

第三，线性复杂度落地。 在1M上下文下：

每token计算量仅为上代模型的1/20
Prefilling阶段加速超9倍
Decoding阶段加速超15倍
绝大部分能力与全注意力基本持平

一句话总结：别人跑1M上下文卡成PPT，M3跑得又快又便宜，还不丢信息。

MiniMax M3

三、Coding与Agent能力：SWE-Bench Pro超GPT-5.5，接近Opus 4.7

M3在代码与智能体方向直接对标国际一线，多项权威Benchmark打出高分，我们只看官方实测、可复现的硬数据：

SWE-Bench Pro（真实软件工程）：MiniMax M3得分59.0%，超GPT-5.5、Gemini 3.1 Pro，接近Opus 4.7。

Terminal Bench 2.1（终端命令执行）：MiniMax M3得分66.0%，接近GPT-5.5、Gemini 3.1 Pro。

SVG-Bench（矢量图代码生成）：MiniMax M3得分63.7%，超过Opus 4.7。

KernelBench Hard（底层内核生成）：MiniMax M3得分28.8%，硬核底层开发能力拉满。

Claw-Eval（自主Agent端到端）：MiniMax M3拿下最高分，自主调度、任务闭环业界第一。

MCP Atlas（多工具协同）：MiniMax M3得分74.2%，接近Opus 4.7。

BrowseComp（浏览信息整合）：MiniMax M3得分83.5%，业界领先水平。

MiniMax M3

为什么M3代码这么强？

官方没有堆Benchmark，而是从真实协作场景下手：

构建交互式用户模拟器框架，模拟需求澄清、方案讨论、多轮迭代、任务切换
让模型在训练阶段就进入真实工程协作环境，而不是单轮指令执行
目标不是"能跑的代码"，而是可直接交付、可长期维护的生产级代码

这也是M3在SWE-Bench Pro这种高难度、抗污染的真实场景里能打赢GPT-5.5的关键原因。

四、原生多模态：从Step 0混合训练，支持图/视频/桌面操作

M3不是"文本模型+多模态插件"，而是从头到尾原生多模态：

从预训练第一步就做文本+图像+视频交错训练
不同模态共享统一语义空间，理解更准、对齐更强
支持图片输入、视频输入、电脑桌面操作（Computer Use）
训练数据管线全面重构，Token规模扩至100万亿量级

实际表现非常恐怖：

看懂论文里的图表、公式、曲线
直接复现顶会论文实验
操作桌面软件、跨应用执行复杂任务

这也是M3能完成12小时无人干预复现ICLR顶会论文、24小时自主优化CUDA内核到71.3%利用率的基础。

五、三大实测名场面：真正的长程Agent实力

MiniMax官方放出了三个极具说服力的真实任务，全部无人工干预：

1. 顶会论文全自动复现

任务：复现ICLR 2025杰出论文《Learning Dynamics of LLM Finetuning》
过程：近12小时自主运行
产出：18次commit、23张实验图表
结果：复现SFT概率变化、DPO squeezing效应、验证Extend方法，完全复现论文结论

MiniMax M3

2. CUDA算子自主优化（Hopper FP8 GEMM）

起点：仅任务描述+基准脚本+无法运行的Triton骨架
过程：24小时、147次benchmark、1959次工具调用，无人工介入
结果：硬件利用率从7.6% → 71.3%，速度提升9.4倍，达到生产级标准

MiniMax M3

3. 全自动"训模型"

任务：4个Base模型，12小时内完成数据合成→训练→评测→迭代全流程
场景：数学推理、工具调用、科学知识、代码生成
结果：得分0.37，略低于Opus 4.7（0.42）、GPT-5.5（0.39），大幅领先其他模型

MiniMax M3

六、配套产品：MiniMax Code + Token Plan，开箱即用

M3不是孤立模型，配套体系一步到位：

1. MiniMax Code：M3专属智能体

支持大型任务拆解、多Agent并发、动态Workflow
可自主运行数天，持续反思与纠错
支持Computer Use，语音指令操控桌面软件、跨系统操作
计划后续开源，回馈社区

2. Token Plan：价格打到地板

三档订阅，同价位用量远超海外竞品：

Plus 49元/月：6亿token
Max 119元/月：18亿token
Ultra 469元/月：55亿token

官方对比：同价格下，用量约为Claude订阅的15倍，个人开发者狂喜。

3. API开放：限时5折

支持≤512k与1M两档上下文
支持thinking/non-thinking双模式
上线限时7天5折，用M2的价格玩M3
10天内将发布技术报告+开源权重

MiniMax M3

七、行业意义：开源模型第一次正面硬刚闭源天花板

MiniMax M3的发布，标志着几个关键拐点：

国产开源大模型正式进入Frontier区间，代码、长上下文、多模态全面看齐GPT-5.5、Claude Opus、Gemini 3.1 Pro
稀疏注意力从论文走向量产，MSA证明长上下文可以低成本、高效率、高精度落地
Agent不再是概念，长程自主迭代、无人干预完成科研/工程任务成为现实
开源生态开始反向定义技术路线，闭源不再是唯一选择

结语

MiniMax M3用一套非常扎实的技术组合，告诉整个行业：开源模型也能拥有闭源顶级能力。

1M上下文、原生多模态、Frontier级Coding，三项全能、全部开源，再加上极具杀伤力的定价，M3很可能成为2026年开发者、企业级应用的标配底座模型。

技术没有捷径，MiniMax这次用底层创新，真正走到了前沿。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码：

AITOP100平台官方交流社群二维码