百川智能发布Baichuan-M3：国产医疗大模型首次超越GPT-5.2-AITOP100,AI资讯

2026年1月13日，百川智能在媒体沟通会上正式发布新一代开源医疗增强大语言模型Baichuan-M3，这是国产AI在医疗垂直领域取得的标志性突破。该模型在问诊能力、医疗幻觉控制、Healthbench及Healthbench Hard四项核心评测中全面登顶，不仅超越OpenAI的GPT-5.2，更在所有测试环节中优于人类医生表现。

工具体验：百川大模型

技术突破：幻觉率3.5%达全球最低水平

在医疗AI领域，“幻觉”（模型生成虚假或不准确信息）一直是制约应用落地的核心难题。Baichuan-M3通过将事实一致性约束融入训练流程，重构了幻觉抑制的训练范式。在不依赖外部工具或检索增强的纯模型设置下，M3的医疗幻觉率降至3.5%，超越GPT-5.2，创下全球最低纪录。

据介绍，M3还具备原生的“端到端”多模态能力，能够处理医学影像、检验报告等多维度医疗数据，实现从症状描述到诊断建议的完整闭环。这一特性使其在实际临床辅助场景中的适用性大幅提升。

行业观察：AI医疗进入应用主战场

百川智能创始人兼CEO王小川在发布会上表示，自2023年公司创立以来，尽管市场对AI技术存在质疑，但团队始终坚信技术浪潮已经到来。他特别提到，2025年DeepSeek的出现显著提升了医生群体对AI的接受度，也让大众对AI技术的信任度大幅提高，认为其可靠性已超越传统搜索引擎。

“随着OpenAI、Anthropic等国际AI巨头纷纷布局医疗领域，AI医疗已正式进入应用阶段，成为AI技术落地的核心领域。”王小川强调，医疗领域是AI技术的“皇冠明珠”，正在从实验室走向真实应用场景。

市场反响：从质疑到信任的转变

王小川在会上还提到了近期市场热议的蚂蚁集团AI助手“阿福”。他指出，如今“阿福”在电梯间、商场等公共场所随处可见，这反映出AI技术正在快速渗透日常生活。但他同时强调，医疗AI的专业性要求远高于通用场景，需要在准确性、可靠性上达到更严苛的标准。

业内专家认为，Baichuan-M3的发布具有多重意义：首先，它证明国产大模型在垂直领域能够实现对国际顶尖产品的超越；其次，开源策略将加速医疗AI技术的普及和迭代；最后，在医疗幻觉控制上的突破为AI辅助诊断的安全性提供了技术保障。

辅助而非替代的定位

值得注意的是，王小川明确表示，AI在医疗领域的定位是辅助医生而非替代医生。M3虽然在标准化测试中表现优异，但在复杂临床场景下，人类医生的经验判断、患者沟通能力以及伦理决策能力仍不可替代。

从更宏观的角度看，Baichuan-M3的发布标志着中国AI企业在医疗这一高价值垂直赛道上的战略布局取得阶段性成果。在通用大模型竞争日益激烈的背景下，通过深耕专业领域实现差异化突围，或将成为国产AI的重要发展路径。随着技术成熟度的提升和监管政策的完善，AI医疗有望在辅助诊断、健康管理、医学教育等多个场景中发挥更大价值。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码：

aitop100官方交流30群 AIGC大赛社群