4月23日,腾讯正式发布并开源混元Hy3 preview。
这不是一次常规的版本迭代。官方给它的定义是:“混元重建后训练的第一个模型”,也是“混元迄今最智能的模型”。背后是腾讯今年2月对整个预训练和强化学习基础设施的"推倒重来",以及腾讯首席AI科学家姚顺雨入职近四个月后的首款成果。
模型地址:腾讯混元官网

一、模型基本参数
| 项目 | 规格 |
|---|---|
| 模型名称 | 混元 Hy3 preview |
| 发布时间 | 2026年4月23日 |
| 架构类型 | 快慢思考融合的混合专家(MoE)架构 |
| 总参数量 | 2950亿(295B) |
| 激活参数 | 210亿(21B) |
| 激活占比 | 约7.1%(210/2950) |
| 最大上下文长度 | 256K |
| 模型定位 | 混元迄今最智能的模型 |
一个细节值得注意:
Hy3 preview的总参数量是2950亿,但激活参数只有210亿,激活占比约7.1%。这意味着每次推理时,模型只激活全部参数的7%左右,实际计算量远小于一个2950亿的稠密模型。这也是MoE架构的核心价值——用更少的激活参数覆盖更大的知识空间。
二、架构解析:快慢思考融合
2.1 什么是快慢思考融合
Hy3 preview采用了"快慢思考融合"的混合专家架构。
这对应的是人类认知中的两个模式:
- 快思考(System 1):快速、自动、不需要太多计算资源的直觉反应。适合简单问答、事实查询等低难度任务,响应速度快。
- 慢思考(System 2):缓慢、深度、需要更多计算资源的推理过程。适合复杂推理、代码生成、多步任务等高难度场景,质量更高。
传统大模型在设计时通常只能二选一:要么追求速度(推理快但能力有限),要么追求质量(能力强但响应慢)。快慢思考融合的思路是让模型根据任务难度自动选择思考模式——简单任务用快思考,复杂任务切换到慢思考,在速度和能力之间找到最优平衡。
2.2 MoE架构在其中的作用
快慢思考的切换依赖MoE(混合专家)架构来实现。
MoE的核心是多个"专家模块"和一个"路由器"。路由器根据输入内容判断哪些专家最适合处理当前任务,只激活相关的专家子集,而非跑遍所有参数。
慢思考任务通常会激活更多专家(更多计算资源),快思考任务则只激活少数专家(节省资源)。这种灵活性让快慢思考的融合在工程上成为可能——不是简单叠加两个模型,而是一个模型内部根据任务自适应分配计算量。
三、三大设计原则
腾讯官方透露,Hy3 preview的设计坚持三个原则:
| 原则 | 含义 |
|---|---|
| 能力体系化 | 模型能力不是单点突破,而是有完整体系,覆盖从简单到复杂的各类任务 |
| 评测真实化 | 评测指标对标真实使用场景,而非刷榜式基准测试 |
| 性价比最优化 | 在能力提升的同时控制推理成本,不单纯追求参数堆叠 |
"评测真实化"这条很有意思——腾讯特意强调评测指标要对应真实场景,暗示过去有些模型的评测数据与实际使用体验存在落差。Hy3 preview希望通过更贴近实际的评测来建立可信度。
四、核心能力提升
根据官方介绍,Hy3 preview在以下五个核心能力方向实现了全面提升:
1. 复杂推理:处理多步骤逻辑问题、因果分析等高难度推理任务的能力
2. 指令遵循:准确理解并执行复杂指令,特别是长指令和多人设指令
3. 上下文学习:从上下文示例中快速学习新任务,无需额外训练(In-context Learning)
4. 代码生成:编程辅助能力,这也是当前大模型竞争最激烈的赛道之一
5. 智能体任务:作为AI Agent核心引擎,处理多步骤复杂任务的能力
结合搜索结果中提到的数据,在SWE-bench编程能力测试中,Hy3 preview得分74.4%,较前代混元2.0的53.0%提升超过40%,已接近GLM-4.7水平。

五、姚顺雨:入职四个月,从"重建"到"开源"
姚顺雨的背景是理解这次发布的一个重要维度。
他是前OpenAI研究员,今年年初加入腾讯担任首席AI科学家。入职不到四个月,Hy3 preview就正式发布——这意味着从2月完成基础设施重建,到4月23日发布新模型,中间只用了不到三个月。
姚顺雨对这次发布的表述很实在:
“我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升 Hy3 正式版的实用性。”
这句话透露了两个信息:第一,Hy3 preview是一个预览版本,腾讯希望先看社区的实际使用反馈再完善;第二,这是混元大模型"重建"的第一步,混元会继续扩大预训练和强化学习规模,提升模型的智能上限。
六、已上线和即将上线的产品
Hy3 preview目前已首批接入腾讯旗下多款产品:
已上线:腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享
即将上线:微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书
覆盖范围从办公(腾讯文档、WorkBuddy)、开发(CodeBuddy)、社交(QQ)到内容消费(腾讯新闻、微信读书)几乎全矩阵。对于腾讯生态内的用户来说,体验到Hy3 preview的门槛几乎为零。
七、开源的意义
Hy3 preview的开源是这次发布值得关注的另一个点。
腾讯过往在AI大模型上相对保守,主要以闭源服务为主。这次选择开源Hy3 preview,有几个可能的原因:
第一,获取真实反馈。姚顺雨自己说的,希望社区帮他们发现模型的问题和不足,为正式版做优化。
第二,建立开发者生态。CodeBuddy等腾讯开发工具已经接入了Hy3 preview,开源模型权重可以吸引更多开发者基于Hy3做二次开发和集成。
第三,实用主义定位的配套。腾讯给Hy3 preview的定位是"走实用主义路线",开源是快速建立实用生态的最有效路径。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










