2026年1月1日,AI 企业 DeepSeek 发布重磅研究成果 —— 题为《mHC:Manifold-Constrained Hyper-Connections》(《mHC:流形约束超连接》)的学术论文,该论文由 DeepSeek 创始人兼 CEO 梁文锋参与署名,解振达(Zhenda Xie)、韦毅轩(Yixuan Wei)、曹焕琪(Huanqi Cao)为核心贡献者。论文提出的 mHC(流形约束超连接)新网络架构,直指当前大模型训练中的核心难题,为下一代基础模型架构演进提供关键思路。
DeepSeek满血版体验链接: https://www.aitop100.cn/wise/chat

近年来,以超连接(HC)为代表的技术方案,通过拓宽神经网络 “信息传输通道”、丰富通道间连接模式,拓展了过去十年确立的残差连接范式,显著提升了模型性能。但 HC 架构的多样化设计,也带来三大核心问题:破坏残差连接固有的身份映射特性,导致大规模训练稳定性差;模型可扩展性受限;内存访问开销显著增加,制约大模型工业化落地进程。
针对上述痛点,mHC 架构构建了兼顾性能与效率的改进框架:一方面将 HC 的残差连接空间投影至特定流形,精准恢复身份映射特性,解决训练不稳定问题;另一方面通过严谨的基础设施优化,降低内存开销并提升运行效率。通俗而言,若将 AI 大模型类比为 “计算链路”,传统残差连接是 “窄管道” 易拥堵,HC 是 “宽管道” 却易因信息流过强 “崩裂”,而 mHC 则为 “管道” 加装 “智能调节阀”,实现稳定传输与资源节能的双重目标。论文实证数据显示,mHC 在大规模训练中表现出优异效果,不仅能带来切实的性能提升,还显著增强了模型可扩展性。
从 AI 行业发展视角看,mHC 架构的突破具备重要产业价值:其一,降低大模型研发门槛,助力算力有限的中小 AI 企业开发更复杂的大模型,减少硬件投入与训练周期;其二,推动大模型在高复杂度场景落地,如超大规模参数多模态模型、工业级智能决策系统等;其三,重新激活学界对大模型宏观架构设计的关注,深化拓扑结构对模型优化与表征学习影响的认知,为基础架构创新开辟新路径。
值得关注的是,此次 mHC 架构研究并非 DeepSeek 的偶然突破。2025 年以来,该企业虽未推出 R2 或 V4 等重大版本模型,但在迭代与开源领域持续发力:2025 年 11 月底,开源数学推理模型 DeepSeek-Math-V2,成为全球首个达到国际奥数金牌水平且开放使用的数学模型;12 月又同步推出 DeepSeek-V3.2 与 V3.2-Special 版本,持续夯实技术积累。行业人士评价,mHC 架构是 AI 底层技术创新,直击 Transformer 架构基础问题,结合此前技术沉淀,预计 DeepSeek 有望在 V4 版本中实现重大更新。
AITOP100(www.aitop100.cn)-AI资讯频道将持续关注 AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:










