IT之家 2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File System),这是一个专为充分利用现代 SSD 和 RDMA 网络带宽而设计的并行文件系统。该系统展现了惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。

IT之家附上开源地址:https://

github.com/deepseek-ai/3FS

3FS 性能亮点

  • 集群高吞吐: 在 180 节点集群中,3FS 实现了高达 6.6 TiB/s 的聚合读取吞吐量。

  • 基准测试优异: 在 25 节点集群的 GraySort 基准测试中,3FS 达到了 3.66 TiB / min 的吞吐量。

  • 单节点高性能: 每个客户端节点的 KVCache 查找峰值吞吐量超过 40 GiB/s。

  • 架构先进: 3FS 采用去中心化架构,并具备强一致性语义。

3FS 应用场景

3FS 在 DeepSeek 的 V3 / R1 版本中得到广泛应用,涵盖了训练数据预处理、数据集加载、检查点保存 / 重新加载、嵌入向量搜索以及推理过程中的 KVCache 查找等关键环节。此外,DeepSeek 还开源了基于 3FS 的数据处理框架 Smallpond。

声明:该文仅代表作者本人观点,欢迎在下方【顶/踩】按钮中亮出您的态度。