• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

DeepSeek开源计划第五天:3FS强势开源,6.6TiB/s改写AI存储格局

DeepSeek开源计划第五天:3FS强势开源,6.6TiB/s改写AI存储格局
AI TOP100
2025-02-28 10:12:05

DeepSeek在开源周的最后一天,带来了超级重磅的技术惊喜!它发布了专门为当下算力场景打造的高性能并行文件系统3FS(Fire - Flyer File System),还有配套的数据处理框架Smallpond 。

这一套组合简直太牛,直接解决了AI训练和推理时数据处理的大难题,以6.6TiB/s的集群吞吐量,刷新了行业纪录,让分布式存储技术跨进了新阶段。

DeepSeek开源计划第五天

开源原文如下:

DeepSeek开源计划第五天:3FS、用于所有 DeepSeek 数据访问的 Thruste

内容介绍:

3FS、用于所有 DeepSeek 数据访问的 Thruster Fire-Flyer 文件系统 (3FS) - 一种利用现代 SSD 和 RDMA 网络的全部带宽的并行文件系统。

  1. 180 节点集群中的聚合读取吞吐量为 6.6 TiB/s  
  2. 25 节点集群中 GraySort 基准测试的吞吐量为 3.66 TiB/分钟
  3. 每个客户端节点的 KVCache 查找峰值吞吐量超过 40 GiB/s
  4. 具有强一致性语义的分解架构
  5. 在 V3/R1 中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和 KVCache 查找以进行推理

Github地址: https://github.com/deepseek-ai/3FS

Smallpond -3FS→上的数据处理框架:https://github.com/deepseek-ai/smallpond

通俗解释:

1.性能超强:靠架构创新立下新标准

3FS采用去中心化架构,还设计了强一致性语义。在有180个节点的集群里,它能达到6.6TiB/s的聚合读取吞吐量,单个节点的KVCache查找峰值能超过40GiB/s 。在GraySort基准测试中,成绩达到3.66TiB/min(25节点),比老办法强太多了。它把SSD和RDMA网络的特性都优化到极致,让硬件带宽得到充分利用,给千卡级别的AI训练集群稳稳地提供数据。

2.重构场景:给AI工作流全程助力

3FS可是DeepSeek V3/R1版本的核心基础。数据预处理、检查点存储、向量搜索以及推理缓存这些关键环节,都有它的身影。它的共享存储层设计,让分布式开发变得简单多了,而且强一致性保证了大规模并发操作的安全。一起开源的Smallpond框架,有处理PB级数据的轻量能力,靠着DuckDB实现了“无服务化”数据工程,从存储到计算,形成了完整的生态闭环。

3.开源战略:推动AI基建走向大众

这次3FS和Smallpond一起开源,延续了DeepSeek这一周每天发布新技术的节奏。DeepSeek把自家AI业务验证过的系统公开,帮着行业打破数据密集型应用在存储方面的限制。

有分析说,这套方案可能会对Ceph、Lustre这些传统分布式系统产生巨大冲击,尤其是在大模型训练这类场景中,开创了新的模式。

DeepSeek开源计划第4天:三大代码库齐开源,推动V3/R1训练与推理技术革新:【点击查看】

DeepSeek开源第三天:DeepGEMM,为大模型计算提速:【点击查看】

Deepseek开源第二天:DeepEP面向MoE模型的高效通信库:【点击查看】

DeepSeek开源计划首日发布:为Hopper GPU而生的FlashMLA正式亮相‌:【点击查看】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • DeepSeek‌
  • 国家超算互联网中心
  • 硅基流动
相关资讯
  • ChatGPT推出购物研究工具:从产品搜索到个性化推荐的全流程解析

  • 谷歌NotebookLM重磅更新!AI幻灯片生成器正式上线,效率飙升!

  • AI赋能短视频创作:Palo平台2025年正式上线,助力创作者告别内容焦虑

  • 安卓Chrome Canary尝鲜AI图像生成!无需跳转,一键搞定!

  • 突发!OpenAI官宣:GPT-4o API明年2月下线,免费用户还能用多久?

热点资讯

2025年11月18日重磅!蚂蚁集团灵光App震撼上线,30秒生成应用不是梦

7天前
2025年11月18日重磅!蚂蚁集团灵光App震撼上线,30秒生成应用不是梦

Google Gemini 3.0 即将震撼发布!百万级上下文+全模态推理引领AI新时代

7天前
 Google Gemini 3.0 即将震撼发布!百万级上下文+全模态推理引领AI新时代

谷歌NotebookLM迎来史诗级更新!PPT制作神器Slide Decks正式上线,效率起飞!

4天前
谷歌NotebookLM迎来史诗级更新!PPT制作神器Slide Decks正式上线,效率起飞!

AI漫剧广告消耗激增,巨量引擎日均投放达千万级

6天前
AI漫剧广告消耗激增,巨量引擎日均投放达千万级

重磅!谷歌Nano Banana Pro图像生成模型正式上线,Gemini3加持,4K画质惊艳!

4天前
重磅!谷歌Nano Banana Pro图像生成模型正式上线,Gemini3加持,4K画质惊艳!
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有