存储系统中测试数据集的构建方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jzl_root2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据(Big Data)的应用越来越广泛,社会对信息存储的需求在不断地增大;而且随着存储技术的发展,存储系统架构和存储系统软件都变得复杂多样;此外,应用环境,存储的数据也越来越复杂多变;因此,存储系统的管理测试,性能优化等工作变得异常困难和重要。存储系统的性能测试,文件系统元数据管理等方面的研究,都需要大量的负载数据,但数据来源多是以前的trace数据集,这些数据集通常存在数据信息不完整,各种操作混合的问题;而且,现公开的trace数据集缺少相应的文件系统元数据的镜像数据。另外,目前还没有针对大数据应用环境下的可用trace数据集。针对以上问题,提出了一种基于统计分析的采用自相似性模型的trace数据集构建方法。该方法能够生成精确的可重现的文件系统镜像,并能合成相应的大规模的,可定制的文件系统动态负载数据集。文件系统trace负载合成系统通过对实际trace数据集的统计分析,得出动态属性的负载模型并加以评估,用文件系统镜像生成引擎生成文件系统的镜像,用动态负载生成引擎采用自相似模型方法(Self-similarity)来合成动态的可定制的动态负载数据集。实验结果表明,提出的方法能精确地生成文件系统镜像负载;合成的trace数据集的时间到达模式(Arrival Pattern)具有非常高的自相似突发性,其自相似性参数H几乎接近1;而且合成I/O负载的访问模式(Access Pattern)具有较好的突发性和时空局部性。此外,该方法能合成自适应的动态trace数据集。
其他文献
对化石能源的不断开采和使用,对生态环境造成了严重的影响,为了更好地保护地球的生态环境,利用绿色能源和可再生能源以实现可持续发展迫在眉睫。太阳能是一种备受人们亲睐的清洁能源,有着广阔的发展前景。光伏发电作为目前开发太阳能的主要方式,具有安全可靠、应用形式灵活、安装维护简单等优势。但是光伏发电存在电能转化率低、成本高等问题,目前广泛使用的最大功率跟踪控制算法(MPPT),是提高其转换效率的重要手段。首
在当前情况下,关于微电网电压和频率控制方面的探索在世界各国正如火如荼地开展着。在以后的发展中,由多个可以提供电能的子微电网组成的大型多微网配电系统的应用将具有很强的竞争力,这对微电网的功率和电压控制提出更高的要求。虽然目前国内外许多学者已进行了一些研究,但对于微电网功率控制方面的研究仍然是一个瓶颈。各种微源在微电网中输入输出功率和电压不稳定,因此提出有效的功率、电压控制方法尤为重要。本论文的内容是
拒绝服务DoS(Denial of Service)攻击是一种典型的网络安全威胁,尤其是其最新发展出的慢速拒绝服务LDoS(Low-rate Denial of Service)攻击采用了全新的攻击方式,更难以被检测与防范
随着数字信息的爆炸式增长,备份系统中的重复数据越来越多,造成了存储资源和网络带宽的极大浪费,同时增加了处理重复数据的开销。数据去重技术旨在减少数据所占的存储空间和通过
流量识别对互联网的网络安全和网络管理领域具有重要意义。随着新的网络应用的出现和网络应用技术的不断的发展,传统的识别方法的局限性日益体现,端口识别由于P2P等应用对端口
在移动互联网加速发展的形势下,智能化的移动终端对于我们日常生活和工作的影响与日俱增。大量的移动终端接入网络后,在极大地方便了人们生活的同时,也会有大量的私密信息在网络
随着多核技术以及多线程技术的发展,多线程在多核处理器上的调度问题成为研究热点。由于多核处理器结构的复杂性,使得资源管理更困难。当多线程在多核平台上运行时,怎样更好
手绘符号识别技术是人机交互领域的一个重要问题,在最近几年得到了快速发展。其应用领域涉及到民用和军用,覆盖面相当广泛。如电子教学板书过程中的数字公式的在线识别、电子元
视频通信、视频监控等行业的高速发展,对视频图像质量和实时性提出了越来越高的要求。H.264作为新一代的视频编码标准,具有很高的压缩率和图像质量以及良好的网络适应性。但由
高速缓冲存储器对于平衡上层计算组件和底层存储设备间的速度差异有着很重要的作用。有效的缓存管理方案不仅能够提升上层计算组件的计算速度,还能够降低访问底层存储设备的I/