论文部分内容阅读
以云计算、社交网络为代表的大数据时代的到来,使得传统业务信息化需求的不断拓展,同时网络技术不断进步,尤其移动互联网技术的兴趣,大规模网络应用程序的功能和运行模式也发生了巨大的变化,网站的并发访问量和数据处理规模呈爆炸式增长,给网站系统程序和数据服务器的负载能力和稳定性提出了挑战,同时对系统的软硬件性能提出了更高的要求。缓存技术是大型网站性能优化的一个关键技术,本文针对网站缓存的性能优化方案进行了研究,主要工作包括:(1)对服务器数据缓存进行了分析,研究了数据读取缓存模型与数据写入缓存模型,分析了模型中缓存的运行原理,并结合源代码给出了设计与实现方案;在此基础上,研究了一种基于Lucene全文检索的缓冲系统架构,使用Lucene全文检索引擎工具包实现对缓存系统中海量缓存文件的管理和快速检索。采用类似搜索引擎的方式对大规模缓存文件进行管理,一方面减少了缓存系统对内存空间的使用,降低了资源消耗,也减少了内存空间中缓存更新的频率,使得内容中只保留固定类型的局部缓存数据;另一方面,使用Lucene来管理外存储空间的缓存文件,可以不考虑缓存空间的限制,不必对缓存数据类型和数据量进行约束,只需要借助相应的数据索引实现对缓存文件的检索和管理;(2)针对服务器的页面缓存问题,提出了一种基于循环神经网络的缓存方案。在此方案中,首先在源代码执行级别收集页面与数据的相关信息,然后利用循环神经网络的记忆特性,从这些信息中识别出缓存序列的模式,从而能够更精准的选出后续访问频率更高的页面或数据进行缓存,与传统的缓存淘汰与选择算法相比,由于循环神经网络考虑了时间和页面访问顺序,因此效果更好。测试与实际运行结果表明,本文所提出的缓存方案在不影响到网站可靠性的前提下,能有效提高网站的运行性能,提高网站的负载能力。