• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作
AI 对话

小米MiMo-VL:小身材,大能量!多模态模型界的“尖子生”

小米MiMo-VL:小身材,大能量!多模态模型界的“尖子生”
AI TOP100
2025-05-30 16:00:46

小米MiMo-VL:小身材,大能量!多模态模型界的“尖子生”

最近,小米家的MiMo系列又添猛将啦!全新推出的MiMo-VL多模态模型,那叫一个惊艳!它接过了MiMo-7B的接力棒,在图像、视频、语言各种领域都表现得超级棒,简直是全能选手!

听说这MiMo-VL在通用问答和理解推理方面,直接把同等规模的Qwen2.5-VL-7B甩在了身后,而且在GUI Grounding任务上,甚至能媲美那些专门搞这个的模型!这下,Agent时代算是真的要加速到来了!

MiMo-VL模型展示

7B参数,挑战72B!

更厉害的是,MiMo-VL-7B虽然只有7B的参数规模,但在奥林匹克竞赛和各种数学竞赛中,居然能把阿里Qwen-2.5-VL-72B和QVQ-72B-Preview这些参数大户给比下去!甚至还超越了闭源模型GPT-4o!我的天,简直是以下克上的典范!

内部评估用户体验时,MiMo-VL-7B也是一路高歌猛进,直接超过GPT-4o,成了开源模型里的佼佼者。实际用起来,它在复杂图片推理和问答上表现得非常出色,甚至能流畅地完成10多步的GUI操作。比如说,帮你把心仪的小米SU7加入到心愿单,那都不是事儿!

秘密武器:高质量数据+创新算法

MiMo-VL-7B之所以这么厉害,全靠它强大的视觉感知能力,而这又得益于高质量的预训练数据和创新的混合在线强化学习算法(MORL)。在多阶段预训练中,小米收集、清洗、合成了海量的多模态数据,包括图文、视频-文本对、GUI操作序列等等,总共有2.4T tokens!

为了强化长程多模态推理能力,他们还巧妙地分阶段调整不同类型数据的比例。混合在线强化学习更是融合了文本推理、多模态感知+推理、RLHF等多种反馈信号,并通过在线强化学习算法稳定加速训练,全方位提升模型的推理、感知性能和用户体验。这简直就是开了挂啊!

模型地址: https://huggingface.co/XiaomiMiMo。

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 最高千万资助+极速备案!AI微短剧 “沪 8 条” ,短剧出海迎来国家级风口

  • 📢 高考AI限用刷屏!不是全禁!豆包、元宝、文心、讯飞最新回应来了

  • MiniMax M3官宣将至:稀疏注意力颠覆长上下文效率,百万Token推理提速15倍

  • 碾压GPT-5.5!阿里Qwen3.7-Max编程全球第二,35小时长时程Agent颠覆开发范式

  • 短剧行业大地震:万播5元恐慌蔓延,爆款难救亏损,头部公司黯然离场

热点资讯

淘宝视频无限帧 V2.0 AI创意内容挑战赛火热进行中....

6天前
淘宝视频无限帧 V2.0 AI创意内容挑战赛火热进行中....

太空追梦·成就未来|喜之郎首届全国AIGC创想大赛

2天前
太空追梦·成就未来|喜之郎首届全国AIGC创想大赛

🎬AIGC大赛:一镜成真·AI导演创作大赛火热进行中...

7天前
🎬AIGC大赛:一镜成真·AI导演创作大赛火热进行中...

MiniMax M3官宣将至:稀疏注意力颠覆长上下文效率,百万Token推理提速15倍

1天前
MiniMax M3官宣将至:稀疏注意力颠覆长上下文效率,百万Token推理提速15倍

腾讯Marvis马维斯正式上线,系统级AI助手重构PC交互,开启个人AI操作系统时代

6天前
 腾讯Marvis马维斯正式上线,系统级AI助手重构PC交互,开启个人AI操作系统时代
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有