2026年5月25日,面壁智能联合清华大学与OpenBMB开源社区,正式发布并开源中国首个基于华为昇腾平台训练的1.58-bit三值大模型——BitCPM-CANN。

该模型实现了从量化算子、训练算法到全链路框架的国产算力原生开发,在极致压缩显存占用的同时,将模型能力保留率稳定维持在90%至97.2%,为端侧AI、手机大模型、边缘计算提供了可量产的高效方案,标志着我国在低比特大模型自主研发领域迈入全球第一梯队。
一、模型核心信息与参数规格
BitCPM-CANN是面向端侧高效部署设计的1.58-bit三值权重大模型,权重仅使用-1、0、+1三个数值,在压缩率与表达能力之间找到数学最优平衡点。
基础参数
- 模型名称:BitCPM-CANN
- 量化精度:1.58-bit(三值量化)
- 训练平台:华为昇腾AI处理器(CANN全栈原生)
- 模型版本:0.5B / 1B / 3B / 8B 四档参数规模
- 训练底座:MindSpeed加Megatron-LM低比特训练体系
- 序列长度:支持32K长上下文
- 开源平台:HuggingFace、ModelScope权重全量开放
核心能力指标
显存收益:推理阶段释放约6倍显存红利
能力保留:相对同尺寸全精度模型90%至97.2%能力保留
部署场景:旗舰手机、边缘设备、车机、IoT终端、轻量化服务器
二、关键性能数据(与MiniCPM4全精度对照)
本次评测在11项通用任务上进行均分对比,数据真实可复现,完整体现低比特训练的工程成果。
| 模型版本 | 11项任务均分 | 同尺寸MiniCPM4 | 能力保留率 |
|---|---|---|---|
| BitCPM-CANN-8B | 77.84 | 81.31 | 95.70% |
| BitCPM-CANN-3B | 72.32 | 74.42 | 97.20%(最高) |
| BitCPM-CANN-1B | 63.42 | 65.30 | 97.10% |
| BitCPM-CANN-0.5B | 51.98 | 57.71 | 90.10% |
数据来源:面壁智能官方开源评测结果

三、三大技术突破:国产算力加低比特训练加端侧落地
1. 全链路昇腾原生,打破国外低比特生态垄断
BitCPM-CANN实现从0到1的国产算力突破。底层量化算子在昇腾CANN上原生开发,量化感知训练算法全栈自主可控,并行策略、算子融合、分布式训练完全基于昇腾体系,成为全球首个在昇腾平台完成端到端训练的1.58-bit大模型。
这意味着低比特大模型不再依赖国外CUDA生态,国产算力可独立支撑世界级大模型研发。
2. 1.58-bit三值量化:压缩率与精度的甜蜜点
与1-bit二值、4-bit或8-bit常规量化相比,1.58-bit具备独特优势。权重仅-1、0、+1,计算强度大幅下降,避免1-bit模型对称性差、信息丢失严重的问题。相比BF16全精度,显存占用降至十分之一以下,推理效率提升数倍。行业公认,1.58-bit是单位bit承载知识密度最高的位宽。
3. 6倍显存红利,8B模型可直接跑在旗舰手机
显存效率是端侧落地的核心瓶颈。BitCPM-CANN带来同等参数规模下显存占用降低约83%,同显存可运行模型规模扩大约6倍,8B模型可流畅部署在主流旗舰手机,未来可支持60B级超大模型在移动端落地,大幅提升手机智能水平。
四、训练架构与工程体系
面壁智能基于昇腾搭建了公共低比特训练基础设施,后续所有昇腾低比特模型均可复用。
- 环境适配层:CANN算子库、NPU驱动、低比特计算内核
- 训练核心:量化感知训练QAT加知识蒸馏加32K长序列支持
- 工程优化:张量并行、流水线并行、算子融合、显存优化策略
- 工具链:训练、评测、导出、部署一站式支持
该体系大幅降低开发者使用国产算力加低比特模型的门槛,加速技术普惠与产业落地。
五、行业价值与应用场景
1. 破解AI行业显存焦虑
2026年全球显存价格持续上涨,设备内存受限,BitCPM-CANN以极低显存占用,让中小企业、终端厂商用更低成本部署更强AI能力,缓解算力与存储压力。
2. 端侧AI进入大模型时代
手机端可实现离线大模型、AI助手、智能摄影、实时翻译。车机端支持座舱交互、驾驶辅助、本地知识问答。边缘设备覆盖工业质检、安防分析、IoT智能网关。轻量化服务器可实现高并发推理、降低TCO。
3. 国产AI算力生态闭环
BitCPM-CANN证明,国产芯片加国产框架加国产模型算法可独立支撑世界级低比特大模型的训练与落地,构建自主可控的AI技术体系。
六、开源与使用说明
- 模型权重:0.5B、1B、3B、8B全部开源
- 获取渠道:HuggingFace、ModelScope搜索BitCPM-CANN
- 协议:开源可复现,支持学术与商用(遵循官方许可)
- 部署支持:提供昇腾NPU、手机、端侧设备推理示例与工具包
写在最后
BitCPM-CANN的发布,是中国低比特大模型与国产算力融合的重要里程碑。它用真实可测的参数、精度、性能数据证明,低比特不等于低能,小显存也能跑大模型。
从技术突破到产业落地,从模型创新到生态开放,面壁智能与清华大学正在推动大模型从拼参数规模走向拼能力密度、拼部署效率、拼国产自主的新阶段。
AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










