腾讯混元Hy3 preview来了：2950亿参数开源，姚顺雨近四个月后交出首份答卷

腾讯混元Hy3 preview来了：2950亿参数开源，姚顺雨近四个月后交出首份答卷

2026-04-24 14:43:28

4月23日，腾讯正式发布并开源混元Hy3 preview。

这不是一次常规的版本迭代。官方给它的定义是：“混元重建后训练的第一个模型”，也是“混元迄今最智能的模型”。背后是腾讯今年2月对整个预训练和强化学习基础设施的"推倒重来"，以及腾讯首席AI科学家姚顺雨入职近四个月后的首款成果。

模型地址：腾讯混元官网

腾讯混元Hy3 preview

一、模型基本参数

项目	规格
模型名称	混元 Hy3 preview
发布时间	2026年4月23日
架构类型	快慢思考融合的混合专家（MoE）架构
总参数量	2950亿（295B）
激活参数	210亿（21B）
激活占比	约7.1%（210/2950）
最大上下文长度	256K
模型定位	混元迄今最智能的模型

一个细节值得注意：

Hy3 preview的总参数量是2950亿，但激活参数只有210亿，激活占比约7.1%。这意味着每次推理时，模型只激活全部参数的7%左右，实际计算量远小于一个2950亿的稠密模型。这也是MoE架构的核心价值——用更少的激活参数覆盖更大的知识空间。

二、架构解析：快慢思考融合

2.1 什么是快慢思考融合

Hy3 preview采用了"快慢思考融合"的混合专家架构。

这对应的是人类认知中的两个模式：

快思考（System 1）：快速、自动、不需要太多计算资源的直觉反应。适合简单问答、事实查询等低难度任务，响应速度快。
慢思考（System 2）：缓慢、深度、需要更多计算资源的推理过程。适合复杂推理、代码生成、多步任务等高难度场景，质量更高。

传统大模型在设计时通常只能二选一：要么追求速度（推理快但能力有限），要么追求质量（能力强但响应慢）。快慢思考融合的思路是让模型根据任务难度自动选择思考模式——简单任务用快思考，复杂任务切换到慢思考，在速度和能力之间找到最优平衡。

2.2 MoE架构在其中的作用

快慢思考的切换依赖MoE（混合专家）架构来实现。

MoE的核心是多个"专家模块"和一个"路由器"。路由器根据输入内容判断哪些专家最适合处理当前任务，只激活相关的专家子集，而非跑遍所有参数。

慢思考任务通常会激活更多专家（更多计算资源），快思考任务则只激活少数专家（节省资源）。这种灵活性让快慢思考的融合在工程上成为可能——不是简单叠加两个模型，而是一个模型内部根据任务自适应分配计算量。

三、三大设计原则

腾讯官方透露，Hy3 preview的设计坚持三个原则：

原则	含义
能力体系化	模型能力不是单点突破，而是有完整体系，覆盖从简单到复杂的各类任务
评测真实化	评测指标对标真实使用场景，而非刷榜式基准测试
性价比最优化	在能力提升的同时控制推理成本，不单纯追求参数堆叠

"评测真实化"这条很有意思——腾讯特意强调评测指标要对应真实场景，暗示过去有些模型的评测数据与实际使用体验存在落差。Hy3 preview希望通过更贴近实际的评测来建立可信度。

四、核心能力提升

根据官方介绍，Hy3 preview在以下五个核心能力方向实现了全面提升：

1. 复杂推理：处理多步骤逻辑问题、因果分析等高难度推理任务的能力

2. 指令遵循：准确理解并执行复杂指令，特别是长指令和多人设指令

3. 上下文学习：从上下文示例中快速学习新任务，无需额外训练（In-context Learning）

4. 代码生成：编程辅助能力，这也是当前大模型竞争最激烈的赛道之一

5. 智能体任务：作为AI Agent核心引擎，处理多步骤复杂任务的能力

结合搜索结果中提到的数据，在SWE-bench编程能力测试中，Hy3 preview得分74.4%，较前代混元2.0的53.0%提升超过40%，已接近GLM-4.7水平。

腾讯混元Hy3 preview

五、姚顺雨：入职四个月，从"重建"到"开源"

姚顺雨的背景是理解这次发布的一个重要维度。

他是前OpenAI研究员，今年年初加入腾讯担任首席AI科学家。入职不到四个月，Hy3 preview就正式发布——这意味着从2月完成基础设施重建，到4月23日发布新模型，中间只用了不到三个月。

姚顺雨对这次发布的表述很实在：

“我们希望通过这次开源和发布，获得来自开源社区和用户的真实反馈，帮助我们提升 Hy3 正式版的实用性。”

这句话透露了两个信息：第一，Hy3 preview是一个预览版本，腾讯希望先看社区的实际使用反馈再完善；第二，这是混元大模型"重建"的第一步，混元会继续扩大预训练和强化学习规模，提升模型的智能上限。

六、已上线和即将上线的产品

Hy3 preview目前已首批接入腾讯旗下多款产品：

已上线：腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享

即将上线：微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书

覆盖范围从办公（腾讯文档、WorkBuddy）、开发（CodeBuddy）、社交（QQ）到内容消费（腾讯新闻、微信读书）几乎全矩阵。对于腾讯生态内的用户来说，体验到Hy3 preview的门槛几乎为零。

七、开源的意义

Hy3 preview的开源是这次发布值得关注的另一个点。

腾讯过往在AI大模型上相对保守，主要以闭源服务为主。这次选择开源Hy3 preview，有几个可能的原因：

第一，获取真实反馈。姚顺雨自己说的，希望社区帮他们发现模型的问题和不足，为正式版做优化。

第二，建立开发者生态。CodeBuddy等腾讯开发工具已经接入了Hy3 preview，开源模型权重可以吸引更多开发者基于Hy3做二次开发和集成。

第三，实用主义定位的配套。腾讯给Hy3 preview的定位是"走实用主义路线"，开源是快速建立实用生态的最有效路径。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码：

AITOP100平台官方交流社群二维码

0

0

文章来源：AI TOP100

免责声明：本文不代表本平台立场，且不构成投资建议，请谨慎对待。

全部评论

暂无评论

相关AI工具

热点资讯

学AI还能赚钱？AIGC职业成长季开启：选课送积分，学技能、拿证书、接商单，一次搞定！

学AI还能赚钱？AIGC职业成长季开启：选课送积分，学技能、拿证书、接商单，一次搞定！

太空追梦·成就未来喜之郎首届全国AIGC创想大赛获奖名单正式公示

太空追梦·成就未来喜之郎首届全国AIGC创想大赛获奖名单正式公示

「织金秘境·洞见未来」织金洞AIGC视频创意挑战赛

「织金秘境·洞见未来」织金洞AIGC视频创意挑战赛

阿里发布Qwen-Image-3.0：4.5K超长文本输入拉满，攻克多层复杂图文生成商用痛点

阿里发布Qwen-Image-3.0：4.5K超长文本输入拉满，攻克多层复杂图文生成商用痛点

最高奖金8万元！第三届瓦卡奖VACAT全球征稿开启

最高奖金8万元！第三届瓦卡奖VACAT全球征稿开启

分享

0

0

欢迎来到AI Top100！我们聚合全球500+款AI智能软件，提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台，让您轻松了解全球AI领域动态，并为您提供优质服务。

合作伙伴

联系我们

加入AITOP100社群

加入社群

AITOP100商务微信

商务微信

相关链接

服务及隐私政策