MiniMax全球首个开源混合架构推理模型M1问世，性能比肩Gemini 2.5 Pro-AITOP100,AI资讯

2025年6月17日深夜，中国大模型公司MiniMax稀宇科技正式宣布开源其首个推理模型MiniMax-M1，这一重磅发布立即在全球AI界引发轰动。该模型被官方定义为"全球首个开源的大规模混合架构推理模型"，其性能表现已经接近谷歌最新的Gemini 2.5 Pro，标志着中国在AI推理技术领域的又一次重大突破。

MiniMax M1模型展示

技术创新：双线突破颠覆传统架构

MiniMax-M1的发布，背后是一条从传统稠密模型向MoE（混合专家）与线性注意力机制的激进转型之路。该模型在两个关键层面实现了颠覆性创新：

架构层面：独创混合注意力机制

M1采用了独特的Lightning Attention（闪电注意力）混合架构，彻底改变了传统Transformer中的Softmax Attention机制。这一创新使得模型在处理长上下文时具有显著的计算效率优势。

技术报告显示，M1模型拥有4560亿总参数，每个token激活459亿参数，原生支持100万token的上下文窗口——这一数字与谷歌Gemini 2.5 Pro持平，是DeepSeek R1的8倍。更令人瞩目的是，M1支持业内最长的8万token推理输出，在生成长度为10万token时，计算量仅为DeepSeek R1的25%。

算法层面：CISPO强化学习算法

在算法创新方面，M1提出了全新的强化学习算法CISPO（Clipped Importance Sampling Policy Optimization）。该算法通过裁剪重要性采样权重而非传统token更新的方式，有效解决了混合架构模型在强化学习过程中的关键问题。

实验数据表明，CISPO算法的强化学习收敛速度达到现有主流方法的两倍，在AIME测试中比字节跳动的DAPO算法快一倍，显著优于DeepSeek早期使用的GRPO算法。

MiniMax M1性能对比

MiniMax性能表现：全方位超越同类产品

在业内主流的17个评测基准上，MiniMax-M1展现出了令人瞩目的综合实力：

长上下文理解能力全球前二

在长上下文理解基准OpenAI-MRCR和LongBench-v2中，M1的表现远超包括DeepSeek-R1-0528和Qwen3-235B在内的所有开源模型，甚至超越OpenAI o3和Claude 4 Opus，全球排名第二，仅以微弱差距落后于SOTA的Gemini 2.5 Pro。

智能体工具使用能力领跑业界

在TAU-Bench（智能体工具使用）评测中，MiniMax-M1-40k不仅领跑所有开源权重模型，更是战胜了Gemini 2.5 Pro，成为目前在智能体工具使用方面能力最强的模型。

软件工程能力表现突出

在SWE-bench验证基准上，MiniMax-M1-40k和MiniMax-M1-80k分别取得55.6%和56.0%的优异成绩，虽然略逊于DeepSeek-R1-0528的57.6%，但显著超越其他开源权重模型，在软件工程领域展现出强劲竞争力。

成本控制：53万美元打造世界级模型

更令业界震撼的是M1模型极低的训练成本。得益于架构创新和CISPO算法的双重优势，整个强化学习训练过程仅用512块H800 GPU运行3周时间，GPU租赁成本仅为53.47万美元（约合384万元人民币），比原先预期降低了一个数量级。

这一成本控制能力直接转化为产品优势。MiniMax宣布，基于M1的服务将在其App和Web端保持不限量免费使用，同时提供业内最低价格的API服务：

0-32k输入长度：输入0.8元/百万token，输出8元/百万token
32k-128k输入长度：输入1.2元/百万token，输出16元/百万token
128k-1M输入长度：输入2.4元/百万token，输出24元/百万token

前两种模式的性价比均超过DeepSeek-R1，而第三种模式DeepSeek模型甚至不支持，展现出M1在超长上下文处理方面的独特优势。

开源策略：推动行业共同发展

MiniMax此次选择完全开源M1模型，包括完整的模型权重和详细的技术报告，均可在官方Hugging Face和GitHub账号下访问。vLLM和Transformer两个开源项目已提供推理部署支持，SGLang合作也在推进中。

这一开源策略体现了MiniMax对自身技术实力的信心，同时也为全球AI开发者提供了一个性能卓越的推理模型基础设施，有望推动整个行业在推理技术方面的快速发展。

行业影响：重新定义推理模型标准

MiniMax-M1的发布，不仅是技术层面的突破，更是对整个推理模型领域标准的重新定义。其在长上下文处理、智能体工具使用、软件工程等关键能力维度的全面领先，为行业树立了新的标杆。

特别值得关注的是，M1展现出的在通用Agent产品化方面的巨大潜力。从官方发布的demo来看，模型能够轻松处理复杂的代码生成、网页开发、游戏创建等任务，这些能力都指向了未来AI助手产品的核心竞争力。

MiniMax-M1使用方法

针对通用用途和评估，为开发者提供了具有在线搜索功能的聊天机器人和在线 API 。针对通用用途和评估，我们为开发者提供了 MiniMax MCP 服务器，该服务器具有视频生成、图像生成、语音合成和语音克隆等功能。

MiniMax工具介绍： https://www.aitop100.cn/tools/minimax-mcp-server

Hugging Face: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094

GitHub: https://github.com/MiniMax-AI/MiniMax-M1

Tech Report: https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf

未来展望：MiniMaxWeek的更多惊喜

MiniMax官方透露，M1的发布仅仅是为期五天"MiniMaxWeek"的开始。未来四天，公司还将围绕文本、语音和视觉等多模态模型发布更多技术进展，这让业界对MiniMax的技术储备和创新能力充满期待。

从MoE架构的率先应用，到线性注意力的大规模部署，再到如今推理模型的全面突破，MiniMax正在用一系列"非共识"的技术创新，证明自己是一家真正"模型驱动"的AI公司。在当前大模型技术突破普遍降速的背景下，MiniMax展现出的后劲和创新活力，为中国AI产业的发展注入了新的信心和动力。

随着M1模型的开源和商用，我们有理由相信，这个"全球首个开源大规模混合架构推理模型"将在AI应用的各个领域发挥重要作用，推动人工智能技术向更高层次发展。

本文基于MiniMax官方发布的技术报告和多方权威媒体报道综合编写，展现了中国AI企业在推理技术领域的最新突破和创新成果。