2025年6月17日深夜,中国大模型公司MiniMax稀宇科技正式宣布开源其首个推理模型MiniMax-M1,这一重磅发布立即在全球AI界引发轰动。该模型被官方定义为"全球首个开源的大规模混合架构推理模型",其性能表现已经接近谷歌最新的Gemini 2.5 Pro,标志着中国在AI推理技术领域的又一次重大突破。
技术创新:双线突破颠覆传统架构
MiniMax-M1的发布,背后是一条从传统稠密模型向MoE(混合专家)与线性注意力机制的激进转型之路。该模型在两个关键层面实现了颠覆性创新:
架构层面:独创混合注意力机制
M1采用了独特的Lightning Attention(闪电注意力)混合架构,彻底改变了传统Transformer中的Softmax Attention机制。这一创新使得模型在处理长上下文时具有显著的计算效率优势。
技术报告显示,M1模型拥有4560亿总参数,每个token激活459亿参数,原生支持100万token的上下文窗口——这一数字与谷歌Gemini 2.5 Pro持平,是DeepSeek R1的8倍。更令人瞩目的是,M1支持业内最长的8万token推理输出,在生成长度为10万token时,计算量仅为DeepSeek R1的25%。
算法层面:CISPO强化学习算法
在算法创新方面,M1提出了全新的强化学习算法CISPO(Clipped Importance Sampling Policy Optimization)。该算法通过裁剪重要性采样权重而非传统token更新的方式,有效解决了混合架构模型在强化学习过程中的关键问题。
实验数据表明,CISPO算法的强化学习收敛速度达到现有主流方法的两倍,在AIME测试中比字节跳动的DAPO算法快一倍,显著优于DeepSeek早期使用的GRPO算法。
MiniMax性能表现:全方位超越同类产品
在业内主流的17个评测基准上,MiniMax-M1展现出了令人瞩目的综合实力:
长上下文理解能力全球前二
在长上下文理解基准OpenAI-MRCR和LongBench-v2中,M1的表现远超包括DeepSeek-R1-0528和Qwen3-235B在内的所有开源模型,甚至超越OpenAI o3和Claude 4 Opus,全球排名第二,仅以微弱差距落后于SOTA的Gemini 2.5 Pro。
智能体工具使用能力领跑业界
在TAU-Bench(智能体工具使用)评测中,MiniMax-M1-40k不仅领跑所有开源权重模型,更是战胜了Gemini 2.5 Pro,成为目前在智能体工具使用方面能力最强的模型。
软件工程能力表现突出
在SWE-bench验证基准上,MiniMax-M1-40k和MiniMax-M1-80k分别取得55.6%和56.0%的优异成绩,虽然略逊于DeepSeek-R1-0528的57.6%,但显著超越其他开源权重模型,在软件工程领域展现出强劲竞争力。
成本控制:53万美元打造世界级模型
更令业界震撼的是M1模型极低的训练成本。得益于架构创新和CISPO算法的双重优势,整个强化学习训练过程仅用512块H800 GPU运行3周时间,GPU租赁成本仅为53.47万美元(约合384万元人民币),比原先预期降低了一个数量级。
这一成本控制能力直接转化为产品优势。MiniMax宣布,基于M1的服务将在其App和Web端保持不限量免费使用,同时提供业内最低价格的API服务:
- 0-32k输入长度:输入0.8元/百万token,输出8元/百万token
- 32k-128k输入长度:输入1.2元/百万token,输出16元/百万token
- 128k-1M输入长度:输入2.4元/百万token,输出24元/百万token
前两种模式的性价比均超过DeepSeek-R1,而第三种模式DeepSeek模型甚至不支持,展现出M1在超长上下文处理方面的独特优势。
开源策略:推动行业共同发展
MiniMax此次选择完全开源M1模型,包括完整的模型权重和详细的技术报告,均可在官方Hugging Face和GitHub账号下访问。vLLM和Transformer两个开源项目已提供推理部署支持,SGLang合作也在推进中。
这一开源策略体现了MiniMax对自身技术实力的信心,同时也为全球AI开发者提供了一个性能卓越的推理模型基础设施,有望推动整个行业在推理技术方面的快速发展。
行业影响:重新定义推理模型标准
MiniMax-M1的发布,不仅是技术层面的突破,更是对整个推理模型领域标准的重新定义。其在长上下文处理、智能体工具使用、软件工程等关键能力维度的全面领先,为行业树立了新的标杆。
特别值得关注的是,M1展现出的在通用Agent产品化方面的巨大潜力。从官方发布的demo来看,模型能够轻松处理复杂的代码生成、网页开发、游戏创建等任务,这些能力都指向了未来AI助手产品的核心竞争力。
MiniMax-M1使用方法
针对通用用途和评估,为开发者提供了具有在线搜索功能的聊天机器人和在线 API 。针对通用用途和评估,我们为开发者提供了 MiniMax MCP 服务器, 该服务器具有视频生成、图像生成、语音合成和语音克隆等功能。
MiniMax工具介绍: https://www.aitop100.cn/tools/minimax-mcp-server
Hugging Face: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094
GitHub: https://github.com/MiniMax-AI/MiniMax-M1
Tech Report: https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf
未来展望:MiniMaxWeek的更多惊喜
MiniMax官方透露,M1的发布仅仅是为期五天"MiniMaxWeek"的开始。未来四天,公司还将围绕文本、语音和视觉等多模态模型发布更多技术进展,这让业界对MiniMax的技术储备和创新能力充满期待。
从MoE架构的率先应用,到线性注意力的大规模部署,再到如今推理模型的全面突破,MiniMax正在用一系列"非共识"的技术创新,证明自己是一家真正"模型驱动"的AI公司。在当前大模型技术突破普遍降速的背景下,MiniMax展现出的后劲和创新活力,为中国AI产业的发展注入了新的信心和动力。
随着M1模型的开源和商用,我们有理由相信,这个"全球首个开源大规模混合架构推理模型"将在AI应用的各个领域发挥重要作用,推动人工智能技术向更高层次发展。
本文基于MiniMax官方发布的技术报告和多方权威媒体报道综合编写,展现了中国AI企业在推理技术领域的最新突破和创新成果。