• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

MiniMax全球首个开源混合架构推理模型M1问世,性能比肩Gemini 2.5 Pro

MiniMax全球首个开源混合架构推理模型M1问世,性能比肩Gemini 2.5 Pro
AI TOP100
2025-06-18 14:18:30

2025年6月17日深夜,中国大模型公司MiniMax稀宇科技正式宣布开源其首个推理模型MiniMax-M1,这一重磅发布立即在全球AI界引发轰动。该模型被官方定义为"全球首个开源的大规模混合架构推理模型",其性能表现已经接近谷歌最新的Gemini 2.5 Pro,标志着中国在AI推理技术领域的又一次重大突破。

MiniMax M1模型展示

技术创新:双线突破颠覆传统架构

MiniMax-M1的发布,背后是一条从传统稠密模型向MoE(混合专家)与线性注意力机制的激进转型之路。该模型在两个关键层面实现了颠覆性创新:

架构层面:独创混合注意力机制

M1采用了独特的Lightning Attention(闪电注意力)混合架构,彻底改变了传统Transformer中的Softmax Attention机制。这一创新使得模型在处理长上下文时具有显著的计算效率优势。

技术报告显示,M1模型拥有4560亿总参数,每个token激活459亿参数,原生支持100万token的上下文窗口——这一数字与谷歌Gemini 2.5 Pro持平,是DeepSeek R1的8倍。更令人瞩目的是,M1支持业内最长的8万token推理输出,在生成长度为10万token时,计算量仅为DeepSeek R1的25%。

算法层面:CISPO强化学习算法

在算法创新方面,M1提出了全新的强化学习算法CISPO(Clipped Importance Sampling Policy Optimization)。该算法通过裁剪重要性采样权重而非传统token更新的方式,有效解决了混合架构模型在强化学习过程中的关键问题。

实验数据表明,CISPO算法的强化学习收敛速度达到现有主流方法的两倍,在AIME测试中比字节跳动的DAPO算法快一倍,显著优于DeepSeek早期使用的GRPO算法。

MiniMax M1性能对比

MiniMax性能表现:全方位超越同类产品

在业内主流的17个评测基准上,MiniMax-M1展现出了令人瞩目的综合实力:

长上下文理解能力全球前二

在长上下文理解基准OpenAI-MRCR和LongBench-v2中,M1的表现远超包括DeepSeek-R1-0528和Qwen3-235B在内的所有开源模型,甚至超越OpenAI o3和Claude 4 Opus,全球排名第二,仅以微弱差距落后于SOTA的Gemini 2.5 Pro。

智能体工具使用能力领跑业界

在TAU-Bench(智能体工具使用)评测中,MiniMax-M1-40k不仅领跑所有开源权重模型,更是战胜了Gemini 2.5 Pro,成为目前在智能体工具使用方面能力最强的模型。

软件工程能力表现突出

在SWE-bench验证基准上,MiniMax-M1-40k和MiniMax-M1-80k分别取得55.6%和56.0%的优异成绩,虽然略逊于DeepSeek-R1-0528的57.6%,但显著超越其他开源权重模型,在软件工程领域展现出强劲竞争力。

成本控制:53万美元打造世界级模型

更令业界震撼的是M1模型极低的训练成本。得益于架构创新和CISPO算法的双重优势,整个强化学习训练过程仅用512块H800 GPU运行3周时间,GPU租赁成本仅为53.47万美元(约合384万元人民币),比原先预期降低了一个数量级。

这一成本控制能力直接转化为产品优势。MiniMax宣布,基于M1的服务将在其App和Web端保持不限量免费使用,同时提供业内最低价格的API服务:

  • 0-32k输入长度:输入0.8元/百万token,输出8元/百万token
  • 32k-128k输入长度:输入1.2元/百万token,输出16元/百万token
  • 128k-1M输入长度:输入2.4元/百万token,输出24元/百万token

前两种模式的性价比均超过DeepSeek-R1,而第三种模式DeepSeek模型甚至不支持,展现出M1在超长上下文处理方面的独特优势。

开源策略:推动行业共同发展

MiniMax此次选择完全开源M1模型,包括完整的模型权重和详细的技术报告,均可在官方Hugging Face和GitHub账号下访问。vLLM和Transformer两个开源项目已提供推理部署支持,SGLang合作也在推进中。

这一开源策略体现了MiniMax对自身技术实力的信心,同时也为全球AI开发者提供了一个性能卓越的推理模型基础设施,有望推动整个行业在推理技术方面的快速发展。

行业影响:重新定义推理模型标准

MiniMax-M1的发布,不仅是技术层面的突破,更是对整个推理模型领域标准的重新定义。其在长上下文处理、智能体工具使用、软件工程等关键能力维度的全面领先,为行业树立了新的标杆。

特别值得关注的是,M1展现出的在通用Agent产品化方面的巨大潜力。从官方发布的demo来看,模型能够轻松处理复杂的代码生成、网页开发、游戏创建等任务,这些能力都指向了未来AI助手产品的核心竞争力。

MiniMax-M1使用方法

minimax

针对通用用途和评估,为开发者提供了具有在线搜索功能的聊天机器人和在线 API 。针对通用用途和评估,我们为开发者提供了 MiniMax MCP 服务器, 该服务器具有视频生成、图像生成、语音合成和语音克隆等功能。

MiniMax工具介绍: https://www.aitop100.cn/tools/minimax-mcp-server

Hugging Face:  https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094

GitHub:  https://github.com/MiniMax-AI/MiniMax-M1

Tech Report: https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf

未来展望:MiniMaxWeek的更多惊喜

MiniMax官方透露,M1的发布仅仅是为期五天"MiniMaxWeek"的开始。未来四天,公司还将围绕文本、语音和视觉等多模态模型发布更多技术进展,这让业界对MiniMax的技术储备和创新能力充满期待。

从MoE架构的率先应用,到线性注意力的大规模部署,再到如今推理模型的全面突破,MiniMax正在用一系列"非共识"的技术创新,证明自己是一家真正"模型驱动"的AI公司。在当前大模型技术突破普遍降速的背景下,MiniMax展现出的后劲和创新活力,为中国AI产业的发展注入了新的信心和动力。

随着M1模型的开源和商用,我们有理由相信,这个"全球首个开源大规模混合架构推理模型"将在AI应用的各个领域发挥重要作用,推动人工智能技术向更高层次发展。



本文基于MiniMax官方发布的技术报告和多方权威媒体报道综合编写,展现了中国AI企业在推理技术领域的最新突破和创新成果。



0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • MiniMax Agent:MiniMax通用型AI智能体
  • MiniMaxMCPServer:MCP多模态AI服务器
  • Speech-02:MiniMax Audio AI语音合成模型
  • 海螺视频APP:MiniMax的AI视频生成神器
  • Minimax:ABAB大模型
相关资讯
  • QQ音乐牵手腾讯元宝:模糊搜歌、场景配乐、划线即播玩出新花样

  • 首个支持物理交互的MCP Server,百度小度正式上线

  • Kimi Playground震撼上线:开启AI工具调用新时代,开发者福音来了!

  • 百度推出Tizzy.ai:无广告智能搜索,影视资源与便捷服务一键畅享

  • 智谱清影生视频重磅更新:视频创作迎来“超进化”

热点资讯

马斯克放大招!Grok AI上线动漫AI伴侣,每月30美元能聊“二次元”

4天前
马斯克放大招!Grok AI上线动漫AI伴侣,每月30美元能聊“二次元”

中央美院首届AIGC艺术展来了!7月解锁「数艺拂晓」新体验

3天前
中央美院首届AIGC艺术展来了!7月解锁「数艺拂晓」新体验

会说话的AI编程工具?字节跳动TRAE2.0将加入语音交互

3天前
会说话的AI编程工具?字节跳动TRAE2.0将加入语音交互

每日AI资讯-2025年07月17日

2天前
每日AI资讯-2025年07月17日

美图AI Agent-RoboNeo重磅登场!“一句话”解锁影像与设计新生产力

5天前
美图AI Agent-RoboNeo重磅登场!“一句话”解锁影像与设计新生产力
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有