Web预取与缓存一体化模型研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:shlchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缓存技术和预取技术是解决Web访问延迟问题的主要方案。虽然缓存技术在互联网上有着非常广泛的应用,但是单纯的缓存机制只是利用WWW的访问模式的时间局部性,对于未曾访问过的内容无法缓冲,响应性能依然得不到很大改善。而预取技术是缓存技术的一种有效补充手段,是突破缓存性能上限的最有效的方法。预取可以对用户未请求过的页面进行缓冲,是一种主动的高速缓冲,是缓冲机制由时间局部性向空间局部性的扩展。预取技术在实际应用中必须解决好两个问题,一是预测——推测用户将要访问的Web对象,决定哪些Web对象值得预取;二是预取控制,其效果将直接决定预取技术能否在较大范围中推广而不对网络性能产生严重的负面影响。因此需要根据系统状态决定实际预取哪些Web对象、具体预取多少Web对象,避免消耗过多的网络资源。预取技术和缓存技术的结合可以在Web应用中大大减少用户请求后的等待时间。本文提出了在预取缓存一体化条件下的预取控制策略,并给出了Web对象可预取性的度量方法。 论文首先介绍了互联网所面临的问题及解决方案。然后阐述了缓存和预取技术的基本概念及缓存系统和预取系统的分类与结构,并总结了现有的缓存替换算法和特点,以及现有预测算法和预取控制策略。 接着,介绍了序列模式挖掘相关知识,并详细描述了本文预测模型中采用的基于位图深度优先挖掘算法。该序列模式挖掘采用不同于传统序列挖掘的宽度优先,而是采用基于字典树数据结构的深度优先,同时采用位图保存和计算各序列的支持度,能够较迅速的挖掘出频繁序列。 然后,详细讨论了Web对象的可预取性概念及相应的度量方法。接着在考虑预取-缓存交互的情况下,建立了三种预取控制模型,通过分析预取控制的代价函数,得到进行有效预取控制的阈值,并讨论了预取阈值的下限。预取那些被访问概率超过阈值的对象,能够使得预取代价最小,从而达到进行有效预取控制的目的。模拟实验表明,在预取与缓存交互的条件下,该控制模型能够较好地控制预取,减少系统资源和网络资源的过度消耗。同时给出在不同缓存容量大小和替换算法条件下的真实日志的应采用的预取阂值。 最后,利用上述基于序列模式挖掘的预测模型在预取缓存一体化的条件下对其进行的模拟实验表明该模型具有较好的性能。
其他文献
随着计算机的普及和网络的飞速发展,学校的教务管理工作网上办公已成为大势所趋。不仅在校园网上可以处理教务工作,随着办学规模的不断扩大、校内各部门及分校数量不断增加,教师
随着人们对物理世界智能化要求的加深,信息世界与物理世界产生更多的交互,这是一个必然的发展趋势,信息物理融合系统(Cyber-Physical Systems, CPS)正是伴随着这种趋势应运而
随着计算机网络的迅猛发展和广泛应用,很多企事业单位将自己的数据库连接到网络上,实现了信息共享,人们在享受网络带来极大方便的同时,应清醒地看到网上数据库数据正遭受黑客
随着高性能移动设备和Internet的普及,基于GIS的应用已突破传统领域向着嵌入式和网络化的方向快速发展。基于特定系统,特定环境的GIS系统开发已成为业界的研究热点。其中车载
随着计算机网络技术的飞跃发展,社会对信息化的要求越来越高。传统客户端/服务器结构的应用已经不能满足不断扩大的发布、维护和升级应用程序的需要。此时,基于组件技术的三
实时系统是一种带有时间约束的计算系统,这些系统的许多动作的完成是与时间相关的,即要满足一定的时间限制。为了确保实时系统的正确性和可靠性,需要对其进行严格的分析和验证。
随着TB量级的计算技术与通信技术的发展,TB量级的存储技术成为必然。人们对数据存储与读取速度的要求也越来越高。为了满足这些要求,出现了多种网络存储架构。存储局域网(SAN
随着社会的进步和科学技术的迅猛发展,我们已逐渐迈入以自动化和信息化为平台的智能化社会。智能小区是近年来产生并迅速崛起的一种新型住宅群,它为住户提供了一种更加安全、
随着Internet的飞速发展,各种异构数据交换越来越频繁,XML(eXtensible Markup Language)作为一种Internet上主要的数据表示和交换标准之一,应用范围非常广泛,如电子商务、Web
数据库技术的逐渐成熟、网络技术的迅速普及和计算机硬件的不断出新,使人们采集数据的能力得到了极大的提高,从而导致了全球范围内数据存储量的急剧增大。为增强人们对这些海量