• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

腾讯混元发布HY-1.8B-2Bit端侧模型:内存占用仅600MB,生成速度提升2至3倍

腾讯混元发布HY-1.8B-2Bit端侧模型:内存占用仅600MB,生成速度提升2至3倍
AI TOP100
3小时前

在人工智能技术飞速发展的今天,大模型的应用场景正不断拓展,然而,如何在端侧设备上高效部署大模型,实现“减脂增肌”,一直是行业面临的重要挑战。

2026年2月10日,腾讯混元团队宣布推出面向消费级硬件的极小模型HY-1.8B-2Bit,凭借首个产业级2Bit量化方案,将等效参数量压缩至0.3B,内存占用仅约600MB,体积甚至小于部分常用手机应用,为大模型在端侧的落地应用带来了重大突破。

腾讯混元发布HY-1.8B-2Bit端侧模型

技术突破:2Bit量化攻克精度与体积的双重难题

在模型部署过程中,量化是降低模型体积、提升运行效率的关键技术。然而,量化位数越低,模型的精度损失通常越大,如何在保证性能的同时实现极致压缩,一直是行业内的“不可能任务”。

腾讯混元团队此次放弃了传统的PTQ(后量化)策略,转而采用量化感知训练(QAT),并结合数据优化、弹性拉伸量化及策略创新,成功实现了2Bit量化下的高精度输出。

腾讯混元发布HY-1.8B-2Bit端侧模型

腾讯混元发布HY-1.8B-2Bit端侧模型

实验数据显示,HY-1.8B-2Bit在数学、代码及科学等核心指标上,表现已与4Bit PTQ模型版本持平,这意味着在大幅压缩体积的同时,模型依然保持了极强的“全科能力”。

性能表现:生成速度翻倍,适配多种端侧硬件

得益于极致的压缩技术,HY-1.8B-2Bit在真实端侧设备上的表现令人瞩目。与原始精度模型相比,其生成速度提升了2—3倍,具体表现如下:

  • MacBook M4:在1024输入内,首字时延实现3~8倍加速,生成速度保持2倍以上稳定提升。
  • 天玑9500:对比Q4格式,首字时延加速1.5~2倍,生成速度加速约1.5倍。

此外,HY-1.8B-2Bit还沿用了Hunyuan-1.8B-Instruct的长短思维链能力,用户可根据任务复杂度灵活切换,进一步提升了模型的实用性和灵活性。

全思考能力:长短思维链灵活切换,满足多样化需求

HY-1.8B-2Bit不仅在体积和速度上实现了突破,更在思考能力上保持了高水平。通过沿用Hunyuan-1.8B-Instruct的长短思维链能力,该模型能够根据任务复杂度自动调整思考模式,无论是简单问答还是复杂推理,都能游刃有余。这种灵活性和适应性,使得HY-1.8B-2Bit在端侧AI应用中具有更广泛的适用性。

未来布局:强化学习与模型蒸馏,缩小能力差距

目前,HY-1.8B-2Bit已提供GGUF-int2格式权重,并在Arm SME2技术平台上完成适配,可广泛应用于手机、耳机及智能家居等对离线部署和隐私有极高要求的场景。腾讯混元表示,未来将通过强化学习与模型蒸馏技术,进一步缩小低比特模型与全精度模型的能力差距,推动端侧AI向更高水平发展。

结语:端侧AI的新篇章已经开启

腾讯混元HY-1.8B-2Bit的发布,不仅为大模型在端侧的落地应用提供了新的思路,更为整个行业树立了新的标杆。随着技术的不断进步和应用场景的持续拓展,我们有理由相信,端侧AI将迎来更加广阔的发展空间。

腾讯混元的这一创新,无疑为这一进程注入了新的动力,让我们共同期待端侧AI的美好未来。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AIGC大赛社群AITOP100平台官方交流社群二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 腾讯混元大模型
相关资讯
  • 2026 好上手的AI 3D创作工具推荐:深入解读 V2Fun.art

  • AI内容共创计划新春加码!投稿积分双倍享,春节创作赢好礼

  • Seedance2.0刷屏:字节AI视频生成主打多镜头

  • Seedance2.0+极限切镜完美匹配

  • 2026春节AI大战:GPT-5.3进化与大厂流量重塑

热点资讯

「AI内容共创计划」首周捷报!每人专属1500积分已就位!

8天前
「AI内容共创计划」首周捷报!每人专属1500积分已就位!

千问App春节30亿大免单:AI一句话下单“请客”全国

4天前
千问App春节30亿大免单:AI一句话下单“请客”全国

2026春节AI大战:GPT-5.3进化与大厂流量重塑

4天前
2026春节AI大战:GPT-5.3进化与大厂流量重塑

AIGC大赛:中国·首届AI影视创新榜作品征集

4天前
AIGC大赛:中国·首届AI影视创新榜作品征集

Claude Opus 4.6登场:100万Token长上下文与代码智能体新标杆

4天前
Claude Opus 4.6登场:100万Token长上下文与代码智能体新标杆
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有