2025年9月29日,蚂蚁集团在著名社交媒体平台“X”的官方账号上发推文宣布—全球首个开源的万亿参数推理大模型Ring-1T-preview正式上线。这个预览版模型到底有多猛?对比GPT-5的测试成绩,答案让人直呼"离谱"!
技术实力拆解:
传统大模型遇到复杂问题就卡壳?Ring-1T-preview偏要"反其道而行"!它升级至万亿参数架构后,在AIME25数学推理测试中狂砍92.6分,比Gemini2.5Pro高出整整8分。更夸张的是,在CodeForces编程测试中,它以94.69分碾压GPT-5的93.2分——这哪是追赶?分明是"弯道超车"!
对比表格:Ring-1T-preview vs顶级模型
测试项目 | Ring-1T-preview | GPT-5 | Gemini2.5Pro |
---|---|---|---|
AIME25数学推理 | 92.6 | 94.6 | 84.5 |
CodeForces编程 | 94.69 | 93.2 | 88.7 |
IMO25竞赛题 | 3题全对+2题部分对 | 未公开 | 未参与 |
有趣的是,这个模型的名字"Ring-1T"灵感竟来自蚂蚁集团的"环形数据流"架构——就像把信息在万亿参数中高速传递,形成永不停歇的"智能环流"。
复杂推理能力实测:
蚂蚁百灵团队给Ring-1T-preview出了道"地狱级"考题:国际奥数竞赛(IMO25)真题。结果模型直接"开挂"——第三题一次性解出正确答案,其他四题也推导出部分解法。要知道,这可是人类顶尖数学家的"战场",AI模型能做到这种程度,说是"推理怪兽"也不为过。
开源生态野心:
蚂蚁集团这波操作可不止是秀技术。通过开源代码和论文,他们把万亿参数模型的"炼丹秘籍"全盘托出:从数据清洗流程到训练优化技巧,连训练日志都公开了。更狠的是,Ling2.0家族1T语言基座的后训练正在进行,未来正式版Ring-1T可能带来更大惊喜。
结尾:
从开源代码到碾压GPT-5的实测数据,Ring-1T-preview正在重新定义"开源模型的上限"。这场由蚂蚁集团掀起的AI革命,或许只是万亿参数时代的开场哨——你准备好见证下一个技术奇点了吗?
模型地址: https://huggingface.co/inclusionAI/Ring-1T-preview (海外网站需要科学上网)
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: