跳动百科

DeepSeek开源第五弹:宣布开源3FS,所有Deepseek数据访问的助推器

幸诚梦   来源:网易

DeepSeek开源第五弹:宣布开源3FS,所有Deepseek数据访问的助推器

2025年2月28日,DeepSeek在开源周的第五天宣布了一项重大进展——开源Fire-Flyer文件系统(3FS)。3FS作为一种高性能并行文件系统,专为利用现代SSD和RDMA网络的全部带宽而设计,成为所有Deepseek数据访问的强大助推器。

3FS的主要特性包括分离式架构、强一致性、文件接口以及对多样化工作负载的支持。其性能表现尤为突出,180节点集群中的聚合读取吞吐量高达6.6TiB/s,25节点集群在GraySort基准测试中吞吐量可达3.66TiB/分钟,每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。

3FS在Deepseek的V3/R1版本中发挥了关键作用,涵盖训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查找等任务。这一开源举措无疑将进一步提升Deepseek的数据处理能力,为AI训练和推理工作负载提供有力支持。