• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作热门-AI社区
AI 对话

腾讯混元Hy3 preview来了:2950亿参数开源,姚顺雨近四个月后交出首份答卷

腾讯混元Hy3 preview来了:2950亿参数开源,姚顺雨近四个月后交出首份答卷
AI TOP100
3小时前

4月23日,腾讯正式发布并开源混元Hy3 preview。

这不是一次常规的版本迭代。官方给它的定义是:“混元重建后训练的第一个模型”,也是“混元迄今最智能的模型”。背后是腾讯今年2月对整个预训练和强化学习基础设施的"推倒重来",以及腾讯首席AI科学家姚顺雨入职近四个月后的首款成果。

模型地址:腾讯混元官网

腾讯混元Hy3 preview

一、模型基本参数

项目 规格
模型名称 混元 Hy3 preview
发布时间 2026年4月23日
架构类型 快慢思考融合的混合专家(MoE)架构
总参数量 2950亿(295B)
激活参数 210亿(21B)
激活占比 约7.1%(210/2950)
最大上下文长度 256K
模型定位 混元迄今最智能的模型

一个细节值得注意:

Hy3 preview的总参数量是2950亿,但激活参数只有210亿,激活占比约7.1%。这意味着每次推理时,模型只激活全部参数的7%左右,实际计算量远小于一个2950亿的稠密模型。这也是MoE架构的核心价值——用更少的激活参数覆盖更大的知识空间。

二、架构解析:快慢思考融合

2.1 什么是快慢思考融合

Hy3 preview采用了"快慢思考融合"的混合专家架构。

这对应的是人类认知中的两个模式:

  • 快思考(System 1):快速、自动、不需要太多计算资源的直觉反应。适合简单问答、事实查询等低难度任务,响应速度快。
  • 慢思考(System 2):缓慢、深度、需要更多计算资源的推理过程。适合复杂推理、代码生成、多步任务等高难度场景,质量更高。

传统大模型在设计时通常只能二选一:要么追求速度(推理快但能力有限),要么追求质量(能力强但响应慢)。快慢思考融合的思路是让模型根据任务难度自动选择思考模式——简单任务用快思考,复杂任务切换到慢思考,在速度和能力之间找到最优平衡。

2.2 MoE架构在其中的作用

快慢思考的切换依赖MoE(混合专家)架构来实现。

MoE的核心是多个"专家模块"和一个"路由器"。路由器根据输入内容判断哪些专家最适合处理当前任务,只激活相关的专家子集,而非跑遍所有参数。

慢思考任务通常会激活更多专家(更多计算资源),快思考任务则只激活少数专家(节省资源)。这种灵活性让快慢思考的融合在工程上成为可能——不是简单叠加两个模型,而是一个模型内部根据任务自适应分配计算量。

三、三大设计原则

腾讯官方透露,Hy3 preview的设计坚持三个原则:

原则 含义
能力体系化 模型能力不是单点突破,而是有完整体系,覆盖从简单到复杂的各类任务
评测真实化 评测指标对标真实使用场景,而非刷榜式基准测试
性价比最优化 在能力提升的同时控制推理成本,不单纯追求参数堆叠

"评测真实化"这条很有意思——腾讯特意强调评测指标要对应真实场景,暗示过去有些模型的评测数据与实际使用体验存在落差。Hy3 preview希望通过更贴近实际的评测来建立可信度。

四、核心能力提升

根据官方介绍,Hy3 preview在以下五个核心能力方向实现了全面提升:

1. 复杂推理:处理多步骤逻辑问题、因果分析等高难度推理任务的能力

2. 指令遵循:准确理解并执行复杂指令,特别是长指令和多人设指令

3. 上下文学习:从上下文示例中快速学习新任务,无需额外训练(In-context Learning)

4. 代码生成:编程辅助能力,这也是当前大模型竞争最激烈的赛道之一

5. 智能体任务:作为AI Agent核心引擎,处理多步骤复杂任务的能力

结合搜索结果中提到的数据,在SWE-bench编程能力测试中,Hy3 preview得分74.4%,较前代混元2.0的53.0%提升超过40%,已接近GLM-4.7水平。

腾讯混元Hy3 preview

五、姚顺雨:入职四个月,从"重建"到"开源"

姚顺雨的背景是理解这次发布的一个重要维度。

他是前OpenAI研究员,今年年初加入腾讯担任首席AI科学家。入职不到四个月,Hy3 preview就正式发布——这意味着从2月完成基础设施重建,到4月23日发布新模型,中间只用了不到三个月。

姚顺雨对这次发布的表述很实在:

“我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升 Hy3 正式版的实用性。”

这句话透露了两个信息:第一,Hy3 preview是一个预览版本,腾讯希望先看社区的实际使用反馈再完善;第二,这是混元大模型"重建"的第一步,混元会继续扩大预训练和强化学习规模,提升模型的智能上限。

六、已上线和即将上线的产品

Hy3 preview目前已首批接入腾讯旗下多款产品:

已上线:腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享

即将上线:微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书

覆盖范围从办公(腾讯文档、WorkBuddy)、开发(CodeBuddy)、社交(QQ)到内容消费(腾讯新闻、微信读书)几乎全矩阵。对于腾讯生态内的用户来说,体验到Hy3 preview的门槛几乎为零。

七、开源的意义

Hy3 preview的开源是这次发布值得关注的另一个点。

腾讯过往在AI大模型上相对保守,主要以闭源服务为主。这次选择开源Hy3 preview,有几个可能的原因:

第一,获取真实反馈。姚顺雨自己说的,希望社区帮他们发现模型的问题和不足,为正式版做优化。

第二,建立开发者生态。CodeBuddy等腾讯开发工具已经接入了Hy3 preview,开源模型权重可以吸引更多开发者基于Hy3做二次开发和集成。

第三,实用主义定位的配套。腾讯给Hy3 preview的定位是"走实用主义路线",开源是快速建立实用生态的最有效路径。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 腾讯混元大模型
  • ‌ima
  • WorkBuddy
相关资讯
  • 字节跳动Seed3D 2.0:MoE架构驱动,几何与纹理生成双双达到SOTA水平

  • 腾讯混元3.0:编程能力提升40%,SWE-bench得分74.4%接近GLM-4.7

  • 阿里通义千问开源Qwen3.6-27B:270亿参数稠密模型,编程能力超越15倍参数量MoE模型

  • 大麦娱乐联合阿里通义发布"妙呀"平台:全球首个潮玩创作者AI设计工具

  • 腾讯企鹅虾友大会4.25开启|深圳华侨城创意园AI龙虾线下盛会

热点资讯

一万个平行宇宙-TapNow全球AI影视创作大赛

2天前
一万个平行宇宙-TapNow全球AI影视创作大赛

腾讯云开源CubeSandbox:一台服务器跑2000个AI沙箱,Manus和OpenAI的同款底座有了免费替代

2天前
腾讯云开源CubeSandbox:一台服务器跑2000个AI沙箱,Manus和OpenAI的同款底座有了免费替代

重庆市首届大学生AIGC视频大赛火热开启

1天前
重庆市首届大学生AIGC视频大赛火热开启

千问AI PPT重大升级:智能体架构赋能,从构思到排版全流程自动化

2天前
千问AI PPT重大升级:智能体架构赋能,从构思到排版全流程自动化

每日AI资讯-2026年4月16日

8天前
每日AI资讯-2026年4月16日
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有