• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

360智脑Tiny-R1-32B:小模型,大能量,逼近Deepseek-R1性能

360智脑Tiny-R1-32B:小模型,大能量,逼近Deepseek-R1性能
AI TOP100
2025-02-26 10:53:10

360智脑Tiny-R1-32B模型发布:小参数,高性能

2月24日,由360智脑团队与北京大学联合打造的中等规模推理模型 Tiny-R1-32B-Preview 震撼发布。这款模型凭借仅占 Deepseek-R1-671B 5% 的参数量,成功实现了对其满血性能的逼近,充分展现了小模型在高效推理领域的巨大潜力。

Tiny-R1-32B:关键领域表现突出

Tiny-R1-32B-Preview 在多个关键领域都表现出了非凡的实力。尤其在数学方面,其在 AIME2024 评测中取得了 78.1 分的佳绩,与原版 R1 模型的 79.8 分几乎不相上下,并大幅领先 Deepseek-R1-Distill-Llama-70B 的 70.0 分。 在编程和科学领域,该模型分别在 LiveCodeBench 和 GPQA-Diamond 测试中获得了 61.6 分和 65.0 分,全面超越了当前开源的70B模型 Deepseek-R1-Distill-Llama-70B。这一成果不仅证明了 Tiny-R1-32B-Preview 在性能上的卓越表现,更重要的是,它通过大幅降低参数量,实现了推理成本的显著降低,带来了效率上的飞跃。

360智脑性能测试

“分治-融合”策略:性能突破的关键

这一突破性的成果背后,离不开“分治-融合”这一核心技术的支撑。研究团队首先基于 DeepSeek-R1 生成了海量的领域数据,并分别训练了数学、编程、科学这三大垂直领域的专业模型。紧接着,他们利用 Arcee 团队的 Mergekit 工具进行巧妙的智能融合,从而突破了单一模型的性能瓶颈,实现了多任务的均衡优化。 这种创新的技术路径不仅有效提升了模型的性能,也为未来推理模型的发展方向提供了新的借鉴。

开源共享,推动技术普惠

360智脑团队和北京大学的联合研发团队强调,Tiny-R1-32B-Preview 的成功离不开开源社区的鼎力支持。 该模型得益于 DeepSeek-R1 蒸馏、DeepSeek-R1-Distill-32B 增量训练以及模型融合等先进技术。

为了促进技术的普及和应用,研发团队承诺将全面公开模型仓库,其中包括技术报告、训练代码以及部分数据集。 模型仓库已上线 Hugging Face 平台,方便大家学习使用。

360智脑AI工具地址:【点击登陆】

Hugging Face 平台地址:https://huggingface.co/qihoo360/TinyR1-32B-Preview。

更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 360智脑
相关资讯
  • 即梦AI正式上线火山引擎:企业级AI创意工具开放API,三折优惠助力「创意生产线」

  • 小白也能做!用Nano Banana秒出专属手办图,免费教程附提示词模板

  • Nano Banana出图比例自由了!最新的「垫图大法」解决此类问题

  • ElevenLabs音效模型V2重磅升级:长片段、无缝循环与高保真音频

  • 腾讯混元Voyager世界模型正式开源:业界首个支持原生3D重建的超长漫游AI模型

热点资讯

谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

6天前
谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

8天前
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

5天前
重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

6天前
Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

阶跃星辰发布端到端语音大模型Step-Audio2mini:重新定义“听得懂、会思考、能表达”的AI语音交互

2天前
阶跃星辰发布端到端语音大模型Step-Audio2mini:重新定义“听得懂、会思考、能表达”的AI语音交互
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有