小米 MiMo API 平台今天正式开放了充值功能,标志着向全面商业化服务迈出了重要一步,计费系统也即将上线。该平台为国内和海外市场推出了极具竞争力的定价结构,并引入了独特的 命中缓存 (Context Caching) 折扣机制。虽然国内用户目前需完成个人实名认证(企业认证暂未上线),但平台支持微信支付和支付宝等灵活支付方式。为欢迎开发者,小米提供了免费额度,许多用户反馈注册即获 20 元 初始信用金。

价格与成本效率
该定价策略旨在提供极高的竞争力,特别是针对高吞吐量应用。“命中缓存” 的巨额折扣是其显著特征,将输入成本降低至标准费率的 10%,鼓励在 Agent 工作流中高效复用上下文。
| 区域 | 输入 (标准) | 输入 (命中缓存) | 输出 | |
| 国内 (CN) | 0.7 CNY / M tokens | 0.07 CNY / M tokens | 2.1 CNY / M tokens | |
| 海外 (Global) | 0.1 USD / M tokens | 0.01 USD / M tokens | 0.3 USD / M tokens | |
| 什么是 “命中缓存”?“命中缓存” 定价适用于系统识别到先前处理过的上下文 Token 时。这一机制大幅降低了多轮对话或文档分析等重复性任务的成本,使得复杂 Agent 交互的总拥有成本 (TCO) 显著下降。 | ||||
MiMo-V2-Flash:为速度而生
此次产品的核心是 MiMo-V2-Flash,一款专为 Agent 场景定制的混合专家 (MoE) 模型。它在海量知识容量与极致推理速度之间取得了平衡。
- 架构: 总参数 309B (激活 15B)。采用混合注意力 (Hybrid Attention) + MTP 加速。
- 性能: 在全球开源 Agent 基准测试中排名前 2。
- 效率: 代码能力媲美 Claude 4.5 Sonnet,但推理成本仅为其约 2.5%,生成速度提升 2 倍。
账户与支付渠道
小米针对性地优化了入驻流程,在符合区域法规的同时确保便利性。20 元免费额度在激活后即可供新老用户使用。

国内用户
- 认证: 需个人实名认证。企业认证待定。
- 支付: 小米支付、支付宝、微信支付。
海外用户
- 认证: 直接充值 (无需实名认证)。
- 支付: Apple Pay、Google Pay、信用卡/借记卡。
战略影响
计费系统的推出标志着向商业化和更广泛的开发者采用迈进了一步。鉴于企业认证功能尚未上线,此次发布应被视为开发者入驻和试点使用的进展,而非企业级全面部署就绪的声明。通过 MoE 架构优先考虑 “速度” 和 “低成本”,MiMo-V2-Flash 瞄准了蓬勃发展的 AI Agent 市场,该市场中延迟和单 Token 成本是关键瓶颈。透明的定价模型结合缓存命中带来的节省,使开发者能够准确预测高容量应用的总拥有成本 (TCO)。
随着充值功能的上线,小米 MiMo 为开发者提供了生产环境所需的稳定性和确定性。平台极具竞争力的定价 (0.7 CNY / M tokens) 和技术效率使其在开源模型领域成为强有力的竞争者,为替代更昂贵的闭源解决方案提供了可行的选择。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










