• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

蚂蚁万亿参数思考模型Ring-1T上线开源,多项SOTA被刷新!

蚂蚁万亿参数思考模型Ring-1T上线开源,多项SOTA被刷新!
AI TOP100
3小时前

2025年10月14日凌晨,科技圈又迎来一则重磅消息——蚂蚁集团正式上线万亿参数思考模型Ring-1T,还全面开源了模型权重和训练配方。这Ring-1T到底有多厉害呢?难道它要成为开源模型里的“超级明星”了吗?和之前的一些模型相比,它这次的表现可真是有了质的飞跃。

惊艳表现:多项任务榜上有名

Ring-1T是在9月30日开源的预览版Ring-1T-preview基础上升级至而来的。它持续升级大规模可验证奖励强化学习(RLVR)训练,充分激发了万亿基座的自然语言推理能力。而且通过RLHF训练,完善了模型的通用能力,在各项任务榜单上的表现更加均衡。就像一个全能选手,在各个赛场上都能发挥出色。

数学难题:奥数赛场展锋芒

为了持续激发Ring-1T的数学等复杂推理能力,百灵团队可是下了大功夫。他们挑战了难度更高的IMO2025(国际数学奥林匹克)赛题,把Ring-1T接入多智能体框架AWorld,用纯自然语言推理来解题。实验结果那叫一个惊艳!Ring-1T仅用一次就解出了第1、3、4、5题,达到了IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。

在第三次尝试IMO时,对第2题几何证明也给出了接近满分的证明过程。就连顶流大模型几乎全军覆没的第六题,它也将答案收敛到与Gemini2.5Pro相同的“4048”(正确答案为2112)。这里有个小插曲,据说当时解题过程紧张又刺激,科研人员都捏了一把汗。

下面来看看Ring-1T和其他模型在部分任务上的对比:

模型IMO2025解题表现“人类偏好对齐”测试Arena-Hard V2成功率医疗问答HealthBench测评成绩
Ring-1T解出第1、3、4、5题,达IMO银牌水平;第2题几何证明接近满分;第六题答案收敛到与Gemini2.5Pro相同“4048”81.59(开源模型榜首,逼近GPT-5-Thinking(High)82.91)最高分(开源领域最佳)
其他部分开源模型部分题目未解出,整体表现不如Ring-1T成功率低于Ring-1T成绩低于Ring-1T

Ring-1T

上图是:Ring-1T与业界其它代表性思考模型的性能横评图

通用能力:多领域成绩优异

作为一款思考模型,Ring-1T的通用能力也十分出色。在“人类偏好对齐”测试Arena-Hard V2中,它以81.59的成功率居于开源模型榜首,都快赶上GPT-5-Thinking(High)82.91的成绩了。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T更是以最高分取得开源领域最佳,就像在考试中轻松拿下高分一样厉害。

应对难题:自研算法显身手

万亿参数思考模型训练有个最大的难题,就是训推精度差异。简单来说,就是训练阶段和推理阶段因为实现细节不同,导致训练和推理精度不一致,进而可能让训练崩溃。不过蚂蚁可不怕这个,他们采用了自研的“棒冰(icepop)”算法来应对。这个算法用带掩码的双向截断技术,把训练 - 推理分布差异冻结在低水位,确保长序列、长周期训练不会崩溃。

另外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细优化,实现了单机显存碎片秒级回收、权重零冗余交换,让大规模RL训练能稳定进行。

Ring-1T

图左是:GRPO训推差异随着训练成指数上升,icepop较为平稳;

图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位

架构与训练:高效提升能力

本次发布的Ring-1T模型继续采用Ling2.0架构的1T base模型做后训练。Ling2.0采用了高度稀疏的MoE架构,1/32的专家激活比、FP8混合精度、MTP等诸多特性,实现了高效训练与推理。

在后训练阶段,蚂蚁百灵团队通过LongCoT - SFT + RLVR + RLHF多阶段训练,显著提升了模型的复杂推理能力以及指令跟随和创意写作等通用能力。

未来发展:持续完善性能

据百灵团队透露,Ring-1T模型是他们在万亿思考模型上的首次尝试,后续版本还会继续完善模型性能。目前,用户可以通过HuggingFace、魔搭社区下载模型,还能通过蚂蚁百宝箱等平台在线体验。

值得一提的是,截止目前蚂蚁百灵大模型已经发布了18款模型,形成了从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中有两款万亿参数模型——万亿参数通用大语言模型Ling - 1T、万亿参数思考模型Ring - 1T。随着这两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段,未来的发展让人充满期待。

蚂蚁百灵大模型

其它相关文章如下:

1.蚂蚁集团开源全球首个万亿参数大模型Ring-1T-preview,代码生成力压GPT-5


想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

aitop100官方交流30群

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 蚂蚁集团开源dInfer,突破扩散语言模型推理瓶颈

  • 告别模糊指令:Qoder v0.2.5“一键增强提示词”,提升AI代码生成质量

  • LiblibAI 2.0上线:整合模型、算力与流程,打造一站式AI创作平台

  • 快手72B代码模型开源登顶,KAT-Dev横扫SWE-Bench,国产AI编程再掀热潮

  • Figure03人形机器人上线:聚焦家庭与工业场景,目标售价或降至3万美元

热点资讯

如何免费生成Sora2无水印视频?Lovart开放5天Pro体验,附会员无限攻略

5天前
如何免费生成Sora2无水印视频?Lovart开放5天Pro体验,附会员无限攻略

快手72B代码模型开源登顶,KAT-Dev横扫SWE-Bench,国产AI编程再掀热潮

2天前
快手72B代码模型开源登顶,KAT-Dev横扫SWE-Bench,国产AI编程再掀热潮

2025年国庆期间中国AI应用热潮:智慧出行与文旅的全面爆发

6天前
2025年国庆期间中国AI应用热潮:智慧出行与文旅的全面爆发

国庆长假AI圈却炸了!Sora 2一周爆火全记录:16万下载登顶榜首背后的技术革命与全民狂欢

7天前
国庆长假AI圈却炸了!Sora 2一周爆火全记录:16万下载登顶榜首背后的技术革命与全民狂欢

腾讯元宝生图大升级!一句话秒变设计师,创意从此零门槛?

4天前
腾讯元宝生图大升级!一句话秒变设计师,创意从此零门槛?
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有