论文部分内容阅读
RAID具有高带宽、大容量、高可靠性和易于管理的特性,而广泛应用于存储系统中。随着云计算的发展,如何实现RAID的高效在线扩展成为研究热点。针对已有的RAID-4扩展方法采用循环顺序进行数据迁移,需要移动所有数据块的缺点,清华大学张广艳老师提出了一个新的RAID-4高效扩展方法MAPOL,在保证数据分布一致性的前提下,实现了最小化数据迁移;采用校验盘写操作分离策略,降低外部用户写延迟;并通过元数据懒惰更新策略优化MAPOL,提高扩展效率。本文在linux内核中实现MAPOL,并设计了一个精确的存储系统性能测试工具IOmark,评测采用MAPOL进行RAID-4扩展的系统性能,验证了MAPOL具有提高RAID-4扩展效率和系统性能的双重优势。
在linux内核实现MAPOL,提高扩展效率的同时,保证外部用户的读写访问。采用结构体数组记录每个条带的数据迁移状态,确定迁移窗口内数据重分布结束时间;优化读、写及计算校验和的顺序,并扩大迁移窗口,从而提高扩展效率。采用外部用户访问处理机制,将外部用户访问的逻辑地址转换为系统内部可以识别的物理地址,实现对I/O请求的快速处理。
已有的存储系统性能测试工具缺乏简单而精确地重现I/O负载的能力,容易给存储系统性能指标观测值带来显著误差。IOmark根据来自真实存储系统的I/O记录,使用Linux内核态异步I/O实现对块级别存储系统的访问;通过跟踪生成的I/O请求的状态和I/O记录中的请求时间来控制I/O请求的发送时间,并筛选I/O记录中的盘号来控制负载轻重,从而实现精确地重放I/O负载的功能。实验表明,IOmark能在trace指定时间内将I/O请求发送出去,发送时间误差小;与同类测试工具相比,引入的测试误差小,对存储系统的性能评测更准确。
采用IOmark对MAPOL进行试验评价,向RAID-4阵列播放有代表性的真实负载,将MAPOL与linux2.6.32.9内核自带的RAID扩展方法round-robin进行对比试验,实验结果表明,在添加Financial和TPC-C负载情况下,MAPOL扩展时间分别比round-robin降低了74.216%和79.732%,扩展效率大幅度提高;扩展过程中MAPOL的系统性能高于round-robin;扩展结束之后,二者的系统性能几乎相同。