家人们,最近 AI 界那可是热闹非凡,腾讯也带着它的“秘密武器”——最新大型语言模型“混元 - T1”闪亮登场啦!而且腾讯还放话了,这“混元 - T1”在推理能力上,能和 OpenAI 的最佳推理系统掰掰手腕呢!
腾讯在开发“混元 - T1”的时候,那可是下了大功夫。它高度依赖强化学习,训练后高达 96.7%的算力都拿去提升模型的逻辑推理能力,还有和人类偏好的一致性了。这就好比给模型请了个超级私教,专门训练它的“脑子”,让它变得更聪明。
在多项基准测试里,“混元 - T1”那表现,简直绝了!在测试 14 个学科知识的 MMLU - PRO 评估中,它拿到了 87.2 分,就比 OpenAI 的 o1 模型低那么一丢丢。在科学推理方面,GPQA - diamond 测试里它得了 69.3 分。
重点来了啊,腾讯特别强调了“混元 - T1”在数学方面的超强实力。在 MATH - 500 基准测试中,它直接拿到了 96.2 分的高分,就仅次于 Deepseek - R1。而且啊,它在代码生成(LiveCodeBench:64.9 分)和高难度推理(ArenaHard:91.9 分)这些方面,表现也相当出色。更厉害的是,在好多中文任务上,它的准确率都超过了 90%,这简直就是中文领域的“学霸”啊!
在模型训练这块儿,腾讯也有自己的一套。它采用了课程学习的方法,就像咱们上学一样,从简单到难,逐步增加任务难度。还创新性地开发了个自我奖励系统,用模型的早期版本去评估新版本的输出,这样就能让模型性能一直提升,就像给模型装了个“进步加速器”。
“混元 - T1”采用了 Transformer Mamba 混合架构,腾讯说在相同条件下,这架构处理长文本的速度是传统模型的两倍,这效率简直杠杠的!现在,Hunyuan - T1 已经通过腾讯云对外开放了,在 Hugging Face 上还有演示呢,感兴趣的家人们可以去看看。
这次腾讯发布“混元 - T1”,是继百度和阿里巴巴相继推出号称达到 o1 水平的自研模型后,中国科技巨头在 AI 领域竞争的又一重要动作。值得一说的是,阿里巴巴、百度和 Deepseek 都在积极推行开源战略。人工智能投资者、前谷歌中国区总裁李开复之前还公开说过,这些中国 AI 模型的发展,对 OpenAI 来说可是潜在的生存威胁呢!看来,这 AI 界的“大战”是越来越精彩啦,咱们就拭目以待,看看后续还有啥新花样!