90.66分夺魁:豆包凭什么拿下第一?
SuperCLUE-VLM 2026年4月测评结果近日公布,字节跳动Doubao-Seed-2.0-Pro-260215以90.66分拿下总榜第一,超越了谷歌Gemini-3.1-Pro-Preview(89.35分)。
这不是一次简单的分数领先,而是国产多模态模型在视觉语言领域的一次集中爆发。
17款模型角逐,国产阵营强势霸榜
本次评测覆盖国内外17款主流视觉语言模型,国产阵营表现极为强势:
- 第一梯队:Doubao-Seed-2.0-Pro-260215(90.66分)
- 紧随其后:谷歌Gemini-3.1-Pro-Preview(89.35分)
- 国产军团:阿里Qwen3.5系列、商汤SenseNova、智谱GLM等多款产品跻身前列
- 海外模型:OpenAI GPT-5.4等知名模型仅排在中游位置
三个维度、25项任务,测评体系全面
本次评测涵盖三大维度共25项具体任务:
| 维度 | 内容 | 表现 |
|---|---|---|
| 基础认知 | 通用识别、基础视觉理解 | 国产模型普遍超90分 |
| 视觉推理 | 逻辑推理、场景分析 | 仍需提升 |
| 视觉应用 | 医疗影像、工业检测等专业场景 | 部分场景得分偏低 |
国产模型在基础认知和数据分析上表现尤为突出,得分普遍超过90分,展现出成熟而稳定的能力。但在视觉推理及工业、医疗等专业应用领域,国内模型仍然有待进一步提升。

与3月综合榜的关系
值得注意的是,Doubao-Seed-2.0-Pro在3月SuperCLUE中文大模型综合测评中已拿下国内第一(71.53分),与GPT-5.4仅差0.95分,跻身全球前五。4月的视觉语言专项测评再次验证了豆包在多模态领域的持续领跑能力。
行业意义:从"追赶"到"反超"
这次测评结果释放了一个清晰信号:在中文视觉语言模型赛道,国产模型已经从"追赶者"变成了"领跑者"。过去海外模型在视觉理解领域长期占据优势,现在这一格局正在被快速改写。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










