论文部分内容阅读
网格存储随网格计算而产生,又是高性能计算的瓶颈,因此研究该课题具有很高的实际意义。网格项目组Globus于2005年推出了Globus Toolkit 4,是本文所研究系统的网格开发环境,其中的GridFTP工具集是我们建立多后台模拟文件系统的基础协议。
Linux的虚拟文件系统(VFS)机制可以很方便地挂载多个不同的设备或远程存储,其易用性是得到公认的。本文的目的就是建立一个自己的文件系统,使之可以被挂载到本地,而真正的后台存储是位置透明,名字透明和迁移透明的。
Linux2.4内核和Linux2.6内核在建立文件系统上有很大的差异,连建立内核模块也有不同的处理方式,因此建立一套兼容两个内核的代码是比较困难的挑战。另外,内核模块不会继承其调用进程的上下文,而是处于内核态,由于内核态的运行库完全不用于用户态的运行库,因此现有的GridFTP工具集很难在内核模块中被正确调用。
FUSE是GNU的自由软件,是挂载自己文件系统的开发平台,其不但兼容Linux2.4内核和Linux2.6内核,并且把内核态的文件系统操作函数通过glibc映射到用户态,使得我们碰到的一系列技术难题得到很好的解决。
多后台模拟文件架构的建立也是一个很值得研究的课题,在经历了多个版本的对比后,我们选择了带有信息服务器的分条存储的实现,以完成我们需要的透明性等要求。
要达到系统的稳定性和健壮性,我们依然有许多工作要做,比如信息服务器的分布式实现或cache一致性实现等,都是可见的可以提高系统性能的做法。可以这么说,有了本文建立的gftpfs文件系统,许多成熟的算法和模式都能在我们这个平台上应用,拓展了网格存储的研发领域。