DeepSeek开源第五弹:宣布开源3FS,所有Deepseek数据访问的助推器
2025年2月28日,DeepSeek在开源周的第五天宣布了一项重大进展——开源Fire-Flyer文件系统(3FS)。3FS作为一种高性能并行文件系统,专为利用现代SSD和RDMA网络的全部带宽而设计,成为所有Deepseek数据访问的强大助推器。
3FS的主要特性包括分离式架构、强一致性、文件接口以及对多样化工作负载的支持。其性能表现尤为突出,180节点集群中的聚合读取吞吐量高达6.6TiB/s,25节点集群在GraySort基准测试中吞吐量可达3.66TiB/分钟,每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。
3FS在Deepseek的V3/R1版本中发挥了关键作用,涵盖训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查找等任务。这一开源举措无疑将进一步提升Deepseek的数据处理能力,为AI训练和推理工作负载提供有力支持。
免责声明:免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!