医疗AI迎来里程碑!夸克在8月19日发布《QuarkMed Technical Report》,首次公开其健康大模型突破“主任医师级”能力的技术细节。这款模型不仅通过中国12门核心学科主任医师笔试评测,更在复杂医学推理中展现出“难度越高、优势越明显”的独特性能曲线。
图为:QuarkMed Technical Report
万亿Token专业数据:夯实医疗AI的“地基”
医疗模型的核心挑战在于数据专业性。夸克健康大模型在训练中采用三类核心医疗数据:医学资料、医学知识和医疗记录,总量高达1万亿Token。这些数据有效弥补了通用预训练语料的不足,显著提升模型的准确性和推理能力。
图为:医疗数据源分类及规模
双阶段强化学习:让AI更“懂”临床逻辑
为提升模型正确性与安全性,夸克引入两个强化学习(RL)阶段:
- 大规模医学强化学习:针对复杂场景优化推理能力,确保AI在多步骤诊断中保持逻辑连贯。
- 奖励模型设计:从诚实性、有用性、内容合规性三维度评估输出,调整模型行为符合医疗伦理与规范。
性能实测:高难度任务优势显著
在MedQA等国际权威数据集测试中,夸克健康大模型超越o3-mini等同尺寸模型。尤其在中国医师资格考试(CPQExam)笔试中,题目难度越高,其领先优势越明显,印证了模型在复杂医学推理中的突破。
图为:CPQExam测试结果
开源测试集:推动医疗AI研究透明化
报告最后宣布,夸克将公开医师考试测试集,此举旨在促进医疗AI领域的学术交流与技术迭代。对于研究者而言,这无疑是一份极具价值的“训练指南”。
医疗AI的“专业门槛”正在被重新定义
从数据积累到强化学习,从笔试突破到开源共享,夸克健康大模型的技术路径揭示了一个趋势:医疗AI正在从“辅助工具”向“专业决策者”进化。
当AI能通过主任医师级考试,或许不久的将来,它真的会成为医生们的“得力搭档”。
相关地址: (海外网站需要科学上网)
https://arxiv.org/pdf/2508.11894
https://github.com/Quark-Medical/QuarkMed/blob/main/report/QuarkMed_Technical_Report.pdf
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: