时隔36天,小米大模型再次迎来重大升级,Token效率大幅提升,智能体能力全面跃迁。**
在AI大模型竞争日趋白热化的当下,小米用行动证明了自己在AI领域的决心与实力。4月23日深夜,小米MiMo大模型团队一口气发布了4款新模型,其中旗舰推理模型MiMo-V2.5-Pro的亮相,让业界再次将目光聚焦到这位由"天才少女"罗福莉领衔的团队身上。
作为原DeepSeek核心成员,罗福莉的加入无疑为小米AI注入了强劲动力。此次发布的MiMo-V2.5系列,不仅在智能体能力上实现了质的飞跃,更在Token效率上交出了一份亮眼的成绩单——相比Kimi K2.6节省42% Token,相比Meta Muse Spark节省50% Token。
一、旗舰模型登场:MiMo-V2.5-Pro专攻复杂任务
小米官方将MiMo-V2.5-Pro定义为"小米MiMo迄今最强大模型",这一称号背后是实打实的技术突破。该模型在通用智能体能力、复杂软件工程以及长程任务等核心维度上,已经能够与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型相媲美。
更值得关注的是,该模型在长程任务处理上展现出了惊人的稳定性。根据小米内部测试数据,搭配合适的运行框架,MiMo-V2.5-Pro可以稳定完成单次涉及近千轮工具调用的复杂任务。这意味着,在实际应用场景中,无论是多步骤的代码生成,还是需要反复迭代的系统设计,该模型都能够保持逻辑一致性,准确捕捉上下文中的隐性要求。
在小米自主开发的评估套件MiMo Coding Bench上,MiMo-V2.5-Pro取得了73.7分的成绩,与Claude Opus 4.6的77.1分差距进一步缩小,相比上一代MiMo-V2-Pro的71.5分实现了稳步提升。

二、硬核实测:从编译器到电路设计
为了让用户更直观地感受MiMo-V2.5-Pro的能力,小米团队放出了三个极具代表性的实操案例,每一个都足以让技术从业者刮目相看。
案例一:用Rust实现完整的SysY编译器
这是一个来自北京大学《编译原理》课程的项目,对于本科生而言,通常需要数周时间才能完成。任务要求模型独立完成词法分析器、语法分析器、AST、Koopa IR代码生成、RISC-V汇编后端以及性能优化等多个模块。
MiMo-V2.5-Pro采用了逐层搭建的策略,先构建完整流水线骨架,再逐层攻克各个模块。最终,该模型用时4.3小时、经过672次工具调用,在隐藏测试集上取得满分233分。特别值得一提的是,模型在Koopa IR、RISC-V后端、性能优化上都拿到了满分,首次编译实现了59%的冷启动通过率。
案例二:构建视频编辑器Web应用
当收到"构建一个视频编辑器Web应用"的指令后,MiMo-V2.5-Pro展现出了强大的工程能力。最终交付的应用具备多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等完整功能,代码量达8192行,历经1868次工具调用,在11.5小时的自主工作中完成。
案例三:模拟电路EDA任务
这是三个案例中最具挑战性的一个。任务要求基于台积电180nm CMOS工艺,从零开始设计并优化一款完整的翻转电压跟随器低压差线性稳压器(FVF-LDO)。
模型需要确定功率晶体管尺寸、调整补偿网络并选择合适偏置电压,以使相位裕度、线路调整率、负载调整率、静态电流、电源抑制比和瞬态响应六个指标同时符合规格。这类项目对于经验丰富的模拟电路设计师而言,通常需要数天时间。
MiMo-V2.5-Pro连接到ngspice仿真循环中,经过大约一个小时的闭环迭代,成功生成了满足所有目标指标的设计,其中四个关键指标比初始版本提高了一个数量级。

三、全能选手:MiMo-V2.5覆盖通用场景
与Pro版本定位不同,MiMo-V2.5专为通用智能体场景打造,是一款原生全模态模型。它能够同时处理图像、音频与视频输入,并根据感知到的信息采取行动。
在性能表现上,MiMo-V2.5实现了双重超越:Agent能力全面超越MiMo-V2-Pro,多模态感知全面超越MiMo-V2-Omni。在面向AI智能体的端到端可信评测基准Claw-Eval中,MiMo-V2.5不仅表现超过上一代旗舰,API成本还降低了约50%。
在跨模态推理、视频理解、图表分析等基准测试VideoMME、CharXiv、MMMU-Pro中,MiMo-V2.5的表现逼近甚至超越了Claude Opus 4.6、Gemini 3 Pro、GPT-5.4等闭源模型。在日常编程任务中,该模型超越了Gemini 3.1 Pro,展现出全面均衡的能力。

四、诚意满满:Token Plan全面升级
伴随新模型发布,小米同步优化了订阅式API调用套餐MiMo Token Plan,多项改进直击用户痛点。
首先是计费方式更加透明合理。取消了此前备受争议的1 Token=4 Credits计费方式,且不再区分256k和1M上下文窗口的Credit倍率。新模型中,MiMo-V2.5按1x计费,MiMo-V2.5-Pro按2x计费,简单明了。
其次是推出夜间专属优惠。每天00:00~08:00时段,所有模型Credits消耗速率在原有基础上再打8折,这对于有大量推理需求的用户来说,是一项实打实的成本节约。
在付费模式上,连续包月和包年订阅也已上线。老用户开通自动续费享次月7折,新用户享次月77折;包年订阅一次付款享全年88折,至高可减948.96元。

五、行业观察:终端厂商的AI突围之路
小米MiMo V2.5系列的发布,不仅是产品层面的升级,更折射出终端硬件厂商在AI时代的新战略。
从技术路线来看,小米选择了"轻量化模型+高Token效率"的差异化竞争策略。在保障长链推理、工具调用、多任务协同等核心智能体性能的同时,大幅提升Token使用效率,降低算力与推理成本。这一策略既能够实现媲美超大模型的智能体表现,又兼顾了实用性与普惠性。
从生态布局来看,小米正在将自研底层大模型、系统级权限、全生态服务进行深度绑定与融合。这种做法的优势在于,能够打造真正意义上的系统级原生智能体,而非简单的应用层AI功能叠加。

今年3月,小米MiMo-V2-Pro曾以匿名模型Hunter Alpha的身份现身OpenRouter平台,一度被开发者误认为是即将发布的DeepSeek V4。如今新一代MiMo-V2.5推出,又正值DeepSeek V4被传出将于本周发布,时间点的巧合不禁让人联想到小米在AI领域的野心。
对于小米而言,AI不仅是技术竞赛,更是"人车家全场景"战略的关键一环。通过自研大模型赋能手机、汽车、智能家居等终端设备,小米正在构建一个完整的AI生态闭环。

结语
从MiMo-V2到MiMo-V2.5,短短36天的时间,小米用行动诠释了什么叫"AI加速度"。在罗福莉的带领下,小米大模型团队展现出了强大的技术实力和产品迭代能力。
对于开发者而言,MiMo-V2.5系列的发布意味着又多了一个高性能、高性价比的选择。对于行业而言,小米的入局让AI大模型竞争更加激烈,也推动着整个行业向更高效率、更低成本的方向发展。
未来,随着MiMo-V2.5-TTS Series、MiMo-V2.5-ASR等模型的陆续推出,小米AI的能力版图将更加完整。而这一切,都只是开始。
相关链接:
Xiaomi MiMo开放平台:https://platform.xiaomimimo.com
Xiaomi MiMo Studio体验地址:https://aistudio.xiaomimimo.com/#/c








