• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

DeepSeek开源计划第五天:3FS强势开源,6.6TiB/s改写AI存储格局

DeepSeek开源计划第五天:3FS强势开源,6.6TiB/s改写AI存储格局
AI TOP100
2025-02-28 10:12:05

DeepSeek在开源周的最后一天,带来了超级重磅的技术惊喜!它发布了专门为当下算力场景打造的高性能并行文件系统3FS(Fire - Flyer File System),还有配套的数据处理框架Smallpond 。

这一套组合简直太牛,直接解决了AI训练和推理时数据处理的大难题,以6.6TiB/s的集群吞吐量,刷新了行业纪录,让分布式存储技术跨进了新阶段。

DeepSeek开源计划第五天

开源原文如下:

DeepSeek开源计划第五天:3FS、用于所有 DeepSeek 数据访问的 Thruste

内容介绍:

3FS、用于所有 DeepSeek 数据访问的 Thruster Fire-Flyer 文件系统 (3FS) - 一种利用现代 SSD 和 RDMA 网络的全部带宽的并行文件系统。

  1. 180 节点集群中的聚合读取吞吐量为 6.6 TiB/s  
  2. 25 节点集群中 GraySort 基准测试的吞吐量为 3.66 TiB/分钟
  3. 每个客户端节点的 KVCache 查找峰值吞吐量超过 40 GiB/s
  4. 具有强一致性语义的分解架构
  5. 在 V3/R1 中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和 KVCache 查找以进行推理

Github地址: https://github.com/deepseek-ai/3FS

Smallpond -3FS→上的数据处理框架:https://github.com/deepseek-ai/smallpond

通俗解释:

1.性能超强:靠架构创新立下新标准

3FS采用去中心化架构,还设计了强一致性语义。在有180个节点的集群里,它能达到6.6TiB/s的聚合读取吞吐量,单个节点的KVCache查找峰值能超过40GiB/s 。在GraySort基准测试中,成绩达到3.66TiB/min(25节点),比老办法强太多了。它把SSD和RDMA网络的特性都优化到极致,让硬件带宽得到充分利用,给千卡级别的AI训练集群稳稳地提供数据。

2.重构场景:给AI工作流全程助力

3FS可是DeepSeek V3/R1版本的核心基础。数据预处理、检查点存储、向量搜索以及推理缓存这些关键环节,都有它的身影。它的共享存储层设计,让分布式开发变得简单多了,而且强一致性保证了大规模并发操作的安全。一起开源的Smallpond框架,有处理PB级数据的轻量能力,靠着DuckDB实现了“无服务化”数据工程,从存储到计算,形成了完整的生态闭环。

3.开源战略:推动AI基建走向大众

这次3FS和Smallpond一起开源,延续了DeepSeek这一周每天发布新技术的节奏。DeepSeek把自家AI业务验证过的系统公开,帮着行业打破数据密集型应用在存储方面的限制。

有分析说,这套方案可能会对Ceph、Lustre这些传统分布式系统产生巨大冲击,尤其是在大模型训练这类场景中,开创了新的模式。

DeepSeek开源计划第4天:三大代码库齐开源,推动V3/R1训练与推理技术革新:【点击查看】

DeepSeek开源第三天:DeepGEMM,为大模型计算提速:【点击查看】

Deepseek开源第二天:DeepEP面向MoE模型的高效通信库:【点击查看】

DeepSeek开源计划首日发布:为Hopper GPU而生的FlashMLA正式亮相‌:【点击查看】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • DeepSeek‌
  • 国家超算互联网中心
  • 硅基流动
相关资讯
  • Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

  • 爱诗科技PixVerse V5视频模型全球上线,用户破亿背后藏着哪些狠活?

  • 谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

  • AI录音设备新标杆:Plaud AI Pro深度评测——续航30小时+智能屏幕如何重塑笔记场景?

  • Higgsfield上线Nano Banana:可24小时无限用,AI创作者狂喜!

热点资讯

谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

3天前
谷歌放大招!AI视频工具Google Vids免费开放,普通用户也能玩转专业剪辑

2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

7天前
2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

5天前
Nano Banana AI深度实测教程:Google神秘武器如何重新定义图像编辑标准

重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

2天前
重磅更新!AITOP100平台接入Google Gemini 2.5 Flash Image模型,可免费体验Nano Banana!

Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争

3天前
Anthropic推出Claude Code网页版,降低使用门槛并与OpenAI Codex形成竞争
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有