论文部分内容阅读
当前伴随着互联网技术迅速的发展势头,网络上的数据访问量极具膨胀。但是,Internet用户数不断增加的结果是Web服务器的访问也大大增加,如果在某个网络区域内或者某个固定的时间段内,同一数据反复的从Web服务器中响应给用户,将给Web服务器带来巨大压力,同时占用运营商有限的网络带宽。而Web缓存和预取这两种技术都能很好地改善网络带宽性能、解决网络堵塞和用户访问延时时间过长等问题。论文描述了Web代理服务器的原理和工作机制,在此基础上,研究了Web缓存和预取的基本概念和关键技术、缓存系统和预取算法的分类及工作机制。考虑用户对Web对象访问的时间间隔因素,论文在GDS缓存替换算法的基础上对缓存替换算法做了改进和仿真实验验证改进算法的性能;同时将预取技术应用到代理服务器中,并验证了基于预取技术的Web代理服务缓存系统的性能。Web代理服务器的缓存替换策略的核心是缓存替换算法,缓存策略能够有效的提高代理服务器的性能。综合考虑Web缓存对象的大小、访问次数、访问时间间隔及最近一次被访问时间等因素,本文研究了传统的Web缓存替换算法,分析了常用替换算法LRU、LFU、SIZE、GDS的性能优劣。在系统研究分析GDS和GDSF算法的基础上,提出了GDS的改进算法GDSF-T方案,改进算法除了兼顾文档对象的大小,同时考虑了缓存对象访问次数和存活时间的关系。以Squid代理服务器验证了GDSF-T算法的性能,通过与LRU、GDSF算法的实验对比,结果证明,改进算法GDSF-T在请求命中率和字节命中率方面有较好的提升。目前对于预取技术与缓存技术的研究缺乏对缓存与预取协同应用的研究。本文在提出缓存替换算法改进的基础上,将改进的缓存算法连同通预取技术综合考虑,设计了Web代理服务缓存系统,通过实验证明了该系统能够比传统的代理缓存服务器提高2%-4%的用户请求命中率,证明了缓存与预取结合应用技术比单独使用缓存技术具有更好的性能表现。