2026年1月13日,百川智能在媒体沟通会上正式发布新一代开源医疗增强大语言模型Baichuan-M3,这是国产AI在医疗垂直领域取得的标志性突破。该模型在问诊能力、医疗幻觉控制、Healthbench及Healthbench Hard四项核心评测中全面登顶,不仅超越OpenAI的GPT-5.2,更在所有测试环节中优于人类医生表现。

技术突破:幻觉率3.5%达全球最低水平
在医疗AI领域,“幻觉”(模型生成虚假或不准确信息)一直是制约应用落地的核心难题。Baichuan-M3通过将事实一致性约束融入训练流程,重构了幻觉抑制的训练范式。在不依赖外部工具或检索增强的纯模型设置下,M3的医疗幻觉率降至3.5%,超越GPT-5.2,创下全球最低纪录。
据介绍,M3还具备原生的“端到端”多模态能力,能够处理医学影像、检验报告等多维度医疗数据,实现从症状描述到诊断建议的完整闭环。这一特性使其在实际临床辅助场景中的适用性大幅提升。
行业观察:AI医疗进入应用主战场
百川智能创始人兼CEO王小川在发布会上表示,自2023年公司创立以来,尽管市场对AI技术存在质疑,但团队始终坚信技术浪潮已经到来。他特别提到,2025年DeepSeek的出现显著提升了医生群体对AI的接受度,也让大众对AI技术的信任度大幅提高,认为其可靠性已超越传统搜索引擎。
“随着OpenAI、Anthropic等国际AI巨头纷纷布局医疗领域,AI医疗已正式进入应用阶段,成为AI技术落地的核心领域。”王小川强调,医疗领域是AI技术的“皇冠明珠”,正在从实验室走向真实应用场景。
市场反响:从质疑到信任的转变
王小川在会上还提到了近期市场热议的蚂蚁集团AI助手“阿福”。他指出,如今“阿福”在电梯间、商场等公共场所随处可见,这反映出AI技术正在快速渗透日常生活。但他同时强调,医疗AI的专业性要求远高于通用场景,需要在准确性、可靠性上达到更严苛的标准。
业内专家认为,Baichuan-M3的发布具有多重意义:首先,它证明国产大模型在垂直领域能够实现对国际顶尖产品的超越;其次,开源策略将加速医疗AI技术的普及和迭代;最后,在医疗幻觉控制上的突破为AI辅助诊断的安全性提供了技术保障。
辅助而非替代的定位
值得注意的是,王小川明确表示,AI在医疗领域的定位是辅助医生而非替代医生。M3虽然在标准化测试中表现优异,但在复杂临床场景下,人类医生的经验判断、患者沟通能力以及伦理决策能力仍不可替代。
从更宏观的角度看,Baichuan-M3的发布标志着中国AI企业在医疗这一高价值垂直赛道上的战略布局取得阶段性成果。在通用大模型竞争日益激烈的背景下,通过深耕专业领域实现差异化突围,或将成为国产AI的重要发展路径。随着技术成熟度的提升和监管政策的完善,AI医疗有望在辅助诊断、健康管理、医学教育等多个场景中发挥更大价值。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










