• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

DeepSeek开源计划第五天:3FS强势开源,6.6TiB/s改写AI存储格局

DeepSeek开源计划第五天:3FS强势开源,6.6TiB/s改写AI存储格局
AI TOP100
2025-02-28 10:12:05

DeepSeek在开源周的最后一天,带来了超级重磅的技术惊喜!它发布了专门为当下算力场景打造的高性能并行文件系统3FS(Fire - Flyer File System),还有配套的数据处理框架Smallpond 。

这一套组合简直太牛,直接解决了AI训练和推理时数据处理的大难题,以6.6TiB/s的集群吞吐量,刷新了行业纪录,让分布式存储技术跨进了新阶段。

DeepSeek开源计划第五天

开源原文如下:

DeepSeek开源计划第五天:3FS、用于所有 DeepSeek 数据访问的 Thruste

内容介绍:

3FS、用于所有 DeepSeek 数据访问的 Thruster Fire-Flyer 文件系统 (3FS) - 一种利用现代 SSD 和 RDMA 网络的全部带宽的并行文件系统。

  1. 180 节点集群中的聚合读取吞吐量为 6.6 TiB/s  
  2. 25 节点集群中 GraySort 基准测试的吞吐量为 3.66 TiB/分钟
  3. 每个客户端节点的 KVCache 查找峰值吞吐量超过 40 GiB/s
  4. 具有强一致性语义的分解架构
  5. 在 V3/R1 中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和 KVCache 查找以进行推理

Github地址: https://github.com/deepseek-ai/3FS

Smallpond -3FS→上的数据处理框架:https://github.com/deepseek-ai/smallpond

通俗解释:

1.性能超强:靠架构创新立下新标准

3FS采用去中心化架构,还设计了强一致性语义。在有180个节点的集群里,它能达到6.6TiB/s的聚合读取吞吐量,单个节点的KVCache查找峰值能超过40GiB/s 。在GraySort基准测试中,成绩达到3.66TiB/min(25节点),比老办法强太多了。它把SSD和RDMA网络的特性都优化到极致,让硬件带宽得到充分利用,给千卡级别的AI训练集群稳稳地提供数据。

2.重构场景:给AI工作流全程助力

3FS可是DeepSeek V3/R1版本的核心基础。数据预处理、检查点存储、向量搜索以及推理缓存这些关键环节,都有它的身影。它的共享存储层设计,让分布式开发变得简单多了,而且强一致性保证了大规模并发操作的安全。一起开源的Smallpond框架,有处理PB级数据的轻量能力,靠着DuckDB实现了“无服务化”数据工程,从存储到计算,形成了完整的生态闭环。

3.开源战略:推动AI基建走向大众

这次3FS和Smallpond一起开源,延续了DeepSeek这一周每天发布新技术的节奏。DeepSeek把自家AI业务验证过的系统公开,帮着行业打破数据密集型应用在存储方面的限制。

有分析说,这套方案可能会对Ceph、Lustre这些传统分布式系统产生巨大冲击,尤其是在大模型训练这类场景中,开创了新的模式。

DeepSeek开源计划第4天:三大代码库齐开源,推动V3/R1训练与推理技术革新:【点击查看】

DeepSeek开源第三天:DeepGEMM,为大模型计算提速:【点击查看】

Deepseek开源第二天:DeepEP面向MoE模型的高效通信库:【点击查看】

DeepSeek开源计划首日发布:为Hopper GPU而生的FlashMLA正式亮相‌:【点击查看】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • DeepSeek‌
  • 国家超算互联网中心
  • 硅基流动
相关资讯
  • Meta推出Spatial Lingo:将客厅变成VR语言学习场景

  • OpenAI发布ChatGPT Health:AI健康管家从问诊走向全周期主动管理

  • Google AI Studio迎重大升级:Gemini 3 Pro五大工具开放赋能开发者生态

  • Suno迈入授权时代:2026年政策调整重塑AI音乐商业模式

  • Lightricks重磅发布LTX-2:首个生产级开源音视频同步生成模型

热点资讯

百万奖金+产业落地!2026年1月上旬AIGC热门赛事清单,AI创作者速藏!

3天前
百万奖金+产业落地!2026年1月上旬AIGC热门赛事清单,AI创作者速藏!

《2025抖音科技内容生态报告》:AI创作爆发,创作者增长超82%

4天前
《2025抖音科技内容生态报告》:AI创作爆发,创作者增长超82%

AI大赛:2026道通Physical AI人工智能大赛

6天前
AI大赛:2026道通Physical AI人工智能大赛

2026VPC全国大学生虚拟制作大赛报名开启

5天前
2026VPC全国大学生虚拟制作大赛报名开启

AIGC大赛:B站AI创作大赛-按下故事的生成键

5天前
AIGC大赛:B站AI创作大赛-按下故事的生成键
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有