面壁智能×清华发布BitCPM‑CANN：1.58bit 三值模型，昇腾平台原生训练-AITOP100,AI资讯

2026年5月25日，面壁智能联合清华大学与OpenBMB开源社区，正式发布并开源中国首个基于华为昇腾平台训练的1.58-bit三值大模型——BitCPM-CANN。

面壁智能

该模型实现了从量化算子、训练算法到全链路框架的国产算力原生开发，在极致压缩显存占用的同时，将模型能力保留率稳定维持在90%至97.2%，为端侧AI、手机大模型、边缘计算提供了可量产的高效方案，标志着我国在低比特大模型自主研发领域迈入全球第一梯队。

一、模型核心信息与参数规格

BitCPM-CANN是面向端侧高效部署设计的1.58-bit三值权重大模型，权重仅使用-1、0、+1三个数值，在压缩率与表达能力之间找到数学最优平衡点。

显存收益：推理阶段释放约6倍显存红利
能力保留：相对同尺寸全精度模型90%至97.2%能力保留
部署场景：旗舰手机、边缘设备、车机、IoT终端、轻量化服务器

本次评测在11项通用任务上进行均分对比，数据真实可复现，完整体现低比特训练的工程成果。

模型版本	11项任务均分	同尺寸MiniCPM4	能力保留率
BitCPM-CANN-8B	77.84	81.31	95.70%
BitCPM-CANN-3B	72.32	74.42	97.20%（最高）
BitCPM-CANN-1B	63.42	65.30	97.10%
BitCPM-CANN-0.5B	51.98	57.71	90.10%

数据来源：面壁智能官方开源评测结果

面壁智能

BitCPM-CANN实现从0到1的国产算力突破。底层量化算子在昇腾CANN上原生开发，量化感知训练算法全栈自主可控，并行策略、算子融合、分布式训练完全基于昇腾体系，成为全球首个在昇腾平台完成端到端训练的1.58-bit大模型。

这意味着低比特大模型不再依赖国外CUDA生态，国产算力可独立支撑世界级大模型研发。

与1-bit二值、4-bit或8-bit常规量化相比，1.58-bit具备独特优势。权重仅-1、0、+1，计算强度大幅下降，避免1-bit模型对称性差、信息丢失严重的问题。相比BF16全精度，显存占用降至十分之一以下，推理效率提升数倍。行业公认，1.58-bit是单位bit承载知识密度最高的位宽。

显存效率是端侧落地的核心瓶颈。BitCPM-CANN带来同等参数规模下显存占用降低约83%，同显存可运行模型规模扩大约6倍，8B模型可流畅部署在主流旗舰手机，未来可支持60B级超大模型在移动端落地，大幅提升手机智能水平。

面壁智能基于昇腾搭建了公共低比特训练基础设施，后续所有昇腾低比特模型均可复用。

该体系大幅降低开发者使用国产算力加低比特模型的门槛，加速技术普惠与产业落地。

2026年全球显存价格持续上涨，设备内存受限，BitCPM-CANN以极低显存占用，让中小企业、终端厂商用更低成本部署更强AI能力，缓解算力与存储压力。

手机端可实现离线大模型、AI助手、智能摄影、实时翻译。车机端支持座舱交互、驾驶辅助、本地知识问答。边缘设备覆盖工业质检、安防分析、IoT智能网关。轻量化服务器可实现高并发推理、降低TCO。

BitCPM-CANN证明，国产芯片加国产框架加国产模型算法可独立支撑世界级低比特大模型的训练与落地，构建自主可控的AI技术体系。

BitCPM-CANN的发布，是中国低比特大模型与国产算力融合的重要里程碑。它用真实可测的参数、精度、性能数据证明，低比特不等于低能，小显存也能跑大模型。

从技术突破到产业落地，从模型创新到生态开放，面壁智能与清华大学正在推动大模型从拼参数规模走向拼能力密度、拼部署效率、拼国产自主的新阶段。

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息，带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AITOP100平台官方交流社群二维码：

AITOP100平台官方交流社群二维码