论文部分内容阅读
随着信息社会的发展,越来越多的信息被数字化,尤其是伴随着Internet的发展,数字化的信息呈爆炸式增长。因而在未来几年里,如何存储和管理这些数据将成为人们关注的焦点。七、八十年代,这些数据都被存放在昂贵的中小型机中,由管理员定期维护其中的数据,但这需要较大的投资,且一旦机器出现故障,将会中断系统服务,给企业造成损失。因而人们一直在探索新的存储方法。其中一个重要的发展方向是将多台高性能的PC服务器通过高速局域网连接,在分布式并行操作系统的协调管理下构成分布式并行服务器来存储数据。 本文研究的分布式并行文件系统DPFS(Distributed Parallel File System)是基于Linux的、为分布式并行服务器而设计开发的数据存储系统,用于智能地管理分布式并行服务器中的文件资源。它既能保证系统的高度可靠,又能为提高系统的服务能力及并发度奠定基础。它是分布式并行操作系统的核心部件之一。 本文首先介绍了数据存储的发展概况与新的需求,分布式文件系统对其发展的重要影响以及设计分布式文件系统需要考虑的各种问题;然后分析了为满足分布式并行服务器的功能需求,DPFS应实现的目标;接着介绍了DPFS设计的总体逻辑结构,目录缓存管理模块的结构设计、刷新策略以及该模块在文件读写重定向中的作用,副本表的逻辑、物理结构、对其缓存的管理和同步算法的实现,以及副本智能管理的设计模型及其管理算法的设计与实现,还分析了DPFS对系统可靠性的影响以及在读写文件时与EXT2文件系统性能的比较。最后对分布式并行文件系统未来的发展作了简要的展望。 其中重点讨论了目录缓存中文件读写的重定向逻辑,提出了智能副本管理模型,包括记录副本信息的副本表的实现算法和副本智能动态增删的策略。并以宽带视频服务BOD(Broad-band-service on Demand)为例定量分析了智能副本管理算法的实现。