• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作
AI 对话

面壁智能×清华发布BitCPM‑CANN:1.58bit 三值模型,昇腾平台原生训练

面壁智能×清华发布BitCPM‑CANN:1.58bit 三值模型,昇腾平台原生训练
AI TOP100
15天前

2026年5月25日,面壁智能联合清华大学与OpenBMB开源社区,正式发布并开源中国首个基于华为昇腾平台训练的1.58-bit三值大模型——BitCPM-CANN。

面壁智能

该模型实现了从量化算子、训练算法到全链路框架的国产算力原生开发,在极致压缩显存占用的同时,将模型能力保留率稳定维持在90%至97.2%,为端侧AI、手机大模型、边缘计算提供了可量产的高效方案,标志着我国在低比特大模型自主研发领域迈入全球第一梯队。

一、模型核心信息与参数规格

BitCPM-CANN是面向端侧高效部署设计的1.58-bit三值权重大模型,权重仅使用-1、0、+1三个数值,在压缩率与表达能力之间找到数学最优平衡点。

基础参数

  • 模型名称:BitCPM-CANN
  • 量化精度:1.58-bit(三值量化)
  • 训练平台:华为昇腾AI处理器(CANN全栈原生)
  • 模型版本:0.5B / 1B / 3B / 8B 四档参数规模
  • 训练底座:MindSpeed加Megatron-LM低比特训练体系
  • 序列长度:支持32K长上下文
  • 开源平台:HuggingFace、ModelScope权重全量开放

核心能力指标

显存收益:推理阶段释放约6倍显存红利
能力保留:相对同尺寸全精度模型90%至97.2%能力保留
部署场景:旗舰手机、边缘设备、车机、IoT终端、轻量化服务器

二、关键性能数据(与MiniCPM4全精度对照)

本次评测在11项通用任务上进行均分对比,数据真实可复现,完整体现低比特训练的工程成果。

模型版本 11项任务均分 同尺寸MiniCPM4 能力保留率
BitCPM-CANN-8B 77.84 81.31 95.70%
BitCPM-CANN-3B 72.32 74.42 97.20%(最高)
BitCPM-CANN-1B 63.42 65.30 97.10%
BitCPM-CANN-0.5B 51.98 57.71 90.10%

数据来源:面壁智能官方开源评测结果

面壁智能

三、三大技术突破:国产算力加低比特训练加端侧落地

1. 全链路昇腾原生,打破国外低比特生态垄断

BitCPM-CANN实现从0到1的国产算力突破。底层量化算子在昇腾CANN上原生开发,量化感知训练算法全栈自主可控,并行策略、算子融合、分布式训练完全基于昇腾体系,成为全球首个在昇腾平台完成端到端训练的1.58-bit大模型。

这意味着低比特大模型不再依赖国外CUDA生态,国产算力可独立支撑世界级大模型研发。

2. 1.58-bit三值量化:压缩率与精度的甜蜜点

与1-bit二值、4-bit或8-bit常规量化相比,1.58-bit具备独特优势。权重仅-1、0、+1,计算强度大幅下降,避免1-bit模型对称性差、信息丢失严重的问题。相比BF16全精度,显存占用降至十分之一以下,推理效率提升数倍。行业公认,1.58-bit是单位bit承载知识密度最高的位宽。

3. 6倍显存红利,8B模型可直接跑在旗舰手机

显存效率是端侧落地的核心瓶颈。BitCPM-CANN带来同等参数规模下显存占用降低约83%,同显存可运行模型规模扩大约6倍,8B模型可流畅部署在主流旗舰手机,未来可支持60B级超大模型在移动端落地,大幅提升手机智能水平。

四、训练架构与工程体系

面壁智能基于昇腾搭建了公共低比特训练基础设施,后续所有昇腾低比特模型均可复用。

  • 环境适配层:CANN算子库、NPU驱动、低比特计算内核
  • 训练核心:量化感知训练QAT加知识蒸馏加32K长序列支持
  • 工程优化:张量并行、流水线并行、算子融合、显存优化策略
  • 工具链:训练、评测、导出、部署一站式支持

该体系大幅降低开发者使用国产算力加低比特模型的门槛,加速技术普惠与产业落地。

五、行业价值与应用场景

1. 破解AI行业显存焦虑

2026年全球显存价格持续上涨,设备内存受限,BitCPM-CANN以极低显存占用,让中小企业、终端厂商用更低成本部署更强AI能力,缓解算力与存储压力。

2. 端侧AI进入大模型时代

手机端可实现离线大模型、AI助手、智能摄影、实时翻译。车机端支持座舱交互、驾驶辅助、本地知识问答。边缘设备覆盖工业质检、安防分析、IoT智能网关。轻量化服务器可实现高并发推理、降低TCO。

3. 国产AI算力生态闭环

BitCPM-CANN证明,国产芯片加国产框架加国产模型算法可独立支撑世界级低比特大模型的训练与落地,构建自主可控的AI技术体系。

六、开源与使用说明

  • 模型权重:0.5B、1B、3B、8B全部开源
  • 获取渠道:HuggingFace、ModelScope搜索BitCPM-CANN
  • 协议:开源可复现,支持学术与商用(遵循官方许可)
  • 部署支持:提供昇腾NPU、手机、端侧设备推理示例与工具包

写在最后

BitCPM-CANN的发布,是中国低比特大模型与国产算力融合的重要里程碑。它用真实可测的参数、精度、性能数据证明,低比特不等于低能,小显存也能跑大模型。

从技术突破到产业落地,从模型创新到生态开放,面壁智能与清华大学正在推动大模型从拼参数规模走向拼能力密度、拼部署效率、拼国产自主的新阶段。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 方特帧美剧场首部剧集《我在末世卖炒粉,凶兽全到锅里来》先导预告重磅发布

  • MateClaw v1.5.0 更新:AI 智能体正在从“会执行”走向“可工程化”

  • 快看漫画发布Livo数字生命产品,漫画IP开启AI自运转新时代

  • 微信开放AI生态接入能力,小程序迎来AI调用新机遇

  • 顾全全离职字节跳动Seed,AI for Science赛道迎来创业新变局

热点资讯

🔥横店国际AI短剧生态展映征集:让你的AI作品登陆横店影视产业核心舞台

7天前
🔥横店国际AI短剧生态展映征集:让你的AI作品登陆横店影视产业核心舞台

每日AI资讯-2026年6月01日

8天前
每日AI资讯-2026年6月01日

yoroll×小云雀AI|《丧尸清道夫》宇宙AI短片挑战赛

1天前
yoroll×小云雀AI|《丧尸清道夫》宇宙AI短片挑战赛

小云雀启动短剧出海逐浪计划,多重激励赋能出海机构

1天前
小云雀启动短剧出海逐浪计划,多重激励赋能出海机构

腾讯发布 CodeBuddy Security:企业代码漏洞审计,正在进入“双引擎”时代

4天前
腾讯发布 CodeBuddy Security:企业代码漏洞审计,正在进入“双引擎”时代
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有