• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作热门-AI社区
AI 对话

中国移动MoMA平台上线:一次接入调用300+模型,Token成本降三成

中国移动MoMA平台上线:一次接入调用300+模型,Token成本降三成
AI TOP100
1小时前

2026年5月8日,中国移动在苏州移动云大会主论坛上发布移动模型服务平台MoMA,一口气接入了超过300款主流AI模型,包括自研的九天大模型、DeepSeek、通义千问、豆包、Kimi、GLM等。平台首创Token集约化运营模式,通过智能路由引擎自动匹配最优模型,实现单位Token成本降低约30%、资源占用率减少50%以上。开发者只需一次API接入就能调用全部模型资源,还能选择"成本优先"“效果优先”“均衡优先"三种策略,故障时秒级切换不中断。对政务、金融等高安全场景,MoMA还推出了"机密模型"服务,用硬件隔离实现"可用不可见”。

中国移动MoMA平台

一、一次接入,300+模型随便用

说实话,这个MoMA最打动我的是"一次接入"这个设计。

以前用大模型API,想调用多个模型就得分别对接各家——DeepSeek一套API Key,通义千问一套,豆包又一套,光是文档就能看晕。MoMA把这个流程简化了:统一API网关,一次接入,全部模型都能调。

目前平台已经接入了300多款模型,覆盖文本生成、语音处理、多模态理解等能力。除了中国移动自研的九天大模型,DeepSeek、通义千问、豆包、Kimi、GLM这些主流选手都在里面。政务、金融、工业、医疗、教育……20多个行业场景基本都能覆盖。

这个思路其实有点像"AI界的App Store"——你不用关心模型是谁家的,只要知道我要干什么,平台帮你匹配最合适的那个。

二、智能路由:三种策略自动切换

MoMA首创的智能路由引擎,我觉得是它最有意思的部分。

用户发一个请求过来,引擎先分析你的需求,然后根据你选的策略去匹配模型:

  • 成本优先:优先选最便宜的模型,适合对质量要求不高但调用量大的场景
  • 效果优先:优先选效果最好的模型,适合对质量敏感的场景
  • 均衡优先:在成本和效果之间找平衡点

更关键的是,如果某个模型超时或故障了,平台能秒级切换到备选模型,业务不中断。这个容灾能力对生产环境来说太重要了——你总不能因为某个模型挂了,整个应用就跟着瘫痪吧。

三、Token成本降三成,怎么做到的?

官方数据是:单位Token成本降低约30%,资源占用率减少50%以上。

这个降本效果是怎么来的?主要是几项技术的组合拳:

  • 国产算力自研推理引擎:不依赖英伟达,成本可控
  • 长尾模型调度:把低频调用的模型集中调度,减少资源闲置
  • 智能缓存:相似请求复用缓存结果,不用每次都跑推理
  • 上下文复用:多轮对话的上下文不重复计算
  • Token压缩:对冗余Token进行压缩处理

这套组合拳打下来,成本和资源占用都大幅下降。对调用量大的企业来说,这个降本幅度是实打实的省钱。

四、流式实时计费:用多少付多少

以前用模型API,很多是按包计费——先买一个包,用不完就浪费了。MoMA改成流式实时计费,端到端时延不超过1分钟,真正实现"即用即付"。

这个计费模式对小团队和创业公司特别友好。你不用预估调用量去买包,用多少付多少,账单实时透明。平台还搭建了风控机制,每笔Token的使用都有记录,全链路可观测,方便做成本分析。

五、机密模型:数据安全最后一道防线

对政务、金融这些对数据安全要求极高的场景,MoMA推出了"机密模型"服务。

原理是把模型部署在机密容器中,用硬件隔离实现"可用不可见"——模型可以正常处理你的数据,但计算过程中的数据不会被泄露。这个设计解决了很多政企客户的核心顾虑:用AI可以,但数据不能出域。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 梁文锋自掏200亿!DeepSeek启动500亿首轮融资,剑指全球AI独角兽第一梯队

  • AI角色一键生成工具推荐:V2Fun 打通3D动画智能化创作全流程

  • 商汤发布SenseNova 6.7 Flash-Lite:原生多模态架构打破"视觉转文本"瓶颈,Token消耗直降 60%

  • 宇树科技UniStore全面开放:全球首个人形机器人"应用商店",零代码部署复杂动作

  • Codex + HyperFrames正在吃掉剪辑行业 ,AI重构剪辑逻辑,新手也能实现高效出片

热点资讯

每日AI资讯-2026年5月09日

1天前
每日AI资讯-2026年5月09日

🎬 抖音集团的AI短剧审片标准来了:合规红线、质量要求与过审实操指南

6小时前
🎬 抖音集团的AI短剧审片标准来了:合规红线、质量要求与过审实操指南

宇树科技UniStore全面开放:全球首个人形机器人"应用商店",零代码部署复杂动作

3天前
宇树科技UniStore全面开放:全球首个人形机器人"应用商店",零代码部署复杂动作

Claude Desktop加高围墙:封杀第三方模型,社区玩法两周即废

3天前
Claude Desktop加高围墙:封杀第三方模型,社区玩法两周即废

Codex for Chrome正式上线:非侵入式浏览器协作,跨标签页上下文读取与DevTools调用

2天前
Codex for Chrome正式上线:非侵入式浏览器协作,跨标签页上下文读取与DevTools调用
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有