需求如下
小弟实验室有多台 GPU 服务器,想做一下存储共享(方便大家跑实验,就不用数据和代码拷贝来拷贝去),之前是用的 NFS,所有服务器通过 NFS 挂载同一个大存储服务器的目录。慢慢的发现性能太差而且万一 存储服务器 GG 了就全完了。之前听过一个做分布式文件系统的教授的报告,大概明白一点意思,好像分布式文件系统性能会好一些,而且容错能力也高。
我们主要是 CV 方面的实验,所以训练模型的时候会有大量的图片读取操作,所以针对这方面,有什么好的文件系统推荐么?最好是能像 NFS 那样,挂载成系统文件目录,用起来和本地磁盘没什么区别的,因为组员水平参差不齐,复杂的操作不一定玩得来。
搜了一些帖子,看到有一些选择,比如 ceph,glusterfs,还有对象存储 minio 什么的,但是小弟之前没有接触过这方面,不太敢轻易选定。想请各位比较懂这块的,给个合适的而且维护也不算复杂的推荐。
再次谢过大家了。