• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

腾讯混元发布HY-1.8B-2Bit端侧模型:内存占用仅600MB,生成速度提升2至3倍

腾讯混元发布HY-1.8B-2Bit端侧模型:内存占用仅600MB,生成速度提升2至3倍
AI TOP100
2026-02-10 15:22:00

在人工智能技术飞速发展的今天,大模型的应用场景正不断拓展,然而,如何在端侧设备上高效部署大模型,实现“减脂增肌”,一直是行业面临的重要挑战。

2026年2月10日,腾讯混元团队宣布推出面向消费级硬件的极小模型HY-1.8B-2Bit,凭借首个产业级2Bit量化方案,将等效参数量压缩至0.3B,内存占用仅约600MB,体积甚至小于部分常用手机应用,为大模型在端侧的落地应用带来了重大突破。

腾讯混元发布HY-1.8B-2Bit端侧模型

技术突破:2Bit量化攻克精度与体积的双重难题

在模型部署过程中,量化是降低模型体积、提升运行效率的关键技术。然而,量化位数越低,模型的精度损失通常越大,如何在保证性能的同时实现极致压缩,一直是行业内的“不可能任务”。

腾讯混元团队此次放弃了传统的PTQ(后量化)策略,转而采用量化感知训练(QAT),并结合数据优化、弹性拉伸量化及策略创新,成功实现了2Bit量化下的高精度输出。

腾讯混元发布HY-1.8B-2Bit端侧模型

腾讯混元发布HY-1.8B-2Bit端侧模型

实验数据显示,HY-1.8B-2Bit在数学、代码及科学等核心指标上,表现已与4Bit PTQ模型版本持平,这意味着在大幅压缩体积的同时,模型依然保持了极强的“全科能力”。

性能表现:生成速度翻倍,适配多种端侧硬件

得益于极致的压缩技术,HY-1.8B-2Bit在真实端侧设备上的表现令人瞩目。与原始精度模型相比,其生成速度提升了2—3倍,具体表现如下:

  • MacBook M4:在1024输入内,首字时延实现3~8倍加速,生成速度保持2倍以上稳定提升。
  • 天玑9500:对比Q4格式,首字时延加速1.5~2倍,生成速度加速约1.5倍。

此外,HY-1.8B-2Bit还沿用了Hunyuan-1.8B-Instruct的长短思维链能力,用户可根据任务复杂度灵活切换,进一步提升了模型的实用性和灵活性。

全思考能力:长短思维链灵活切换,满足多样化需求

HY-1.8B-2Bit不仅在体积和速度上实现了突破,更在思考能力上保持了高水平。通过沿用Hunyuan-1.8B-Instruct的长短思维链能力,该模型能够根据任务复杂度自动调整思考模式,无论是简单问答还是复杂推理,都能游刃有余。这种灵活性和适应性,使得HY-1.8B-2Bit在端侧AI应用中具有更广泛的适用性。

未来布局:强化学习与模型蒸馏,缩小能力差距

目前,HY-1.8B-2Bit已提供GGUF-int2格式权重,并在Arm SME2技术平台上完成适配,可广泛应用于手机、耳机及智能家居等对离线部署和隐私有极高要求的场景。腾讯混元表示,未来将通过强化学习与模型蒸馏技术,进一步缩小低比特模型与全精度模型的能力差距,推动端侧AI向更高水平发展。

结语:端侧AI的新篇章已经开启

腾讯混元HY-1.8B-2Bit的发布,不仅为大模型在端侧的落地应用提供了新的思路,更为整个行业树立了新的标杆。随着技术的不断进步和应用场景的持续拓展,我们有理由相信,端侧AI将迎来更加广阔的发展空间。

腾讯混元的这一创新,无疑为这一进程注入了新的动力,让我们共同期待端侧AI的美好未来。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AIGC大赛社群AITOP100平台官方交流社群二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 腾讯混元大模型
相关资讯
  • 横扫11项榜单冠军!蚂蚁集团发布F2LLM-v2:全尺寸多语种的"六边形"嵌入模型

  • 横店"群演"集体失业:AI短剧开启降维打击,单集成本仅需500元

  • Sora退场可灵AI上位:快手CEO下达军令状,AI业务年收入冲击翻倍

  • 告别“手机碎片化办公”:腾讯元宝派电脑版上线,AI智能体进化成“桌面派友”

  • 官方定名Token为 “词元”:140万亿日调用量背后,中国AI迎来新度量衡

热点资讯

每日AI资讯-2026年3月24日

3天前
每日AI资讯-2026年3月24日

央视网AI短片《流金谷恩仇录》为何10小时点赞破百万?深度拆解“武侠+AI”的破圈密码

8天前
央视网AI短片《流金谷恩仇录》为何10小时点赞破百万?深度拆解“武侠+AI”的破圈密码

💥晶核×即梦AI新职业枪侍创作大赛——舞出惊鸿一枪

8天前
💥晶核×即梦AI新职业枪侍创作大赛——舞出惊鸿一枪

第二届“牡丹花都”全球AI创作者大赛火热开启,牡丹花都·AI见洛阳

7天前
第二届“牡丹花都”全球AI创作者大赛火热开启,牡丹花都·AI见洛阳

第三届短剧生态大会|优秀AI短剧展映征集入围公示

4天前
第三届短剧生态大会|优秀AI短剧展映征集入围公示
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有