基于持久性存储器的频繁模式挖掘算法优化研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zl6273008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有效挖掘给定数据集中频繁出现的模式是数据挖掘领域中的重要问题,对数据进行频繁模式挖掘能够揭示隐藏在数据集后面的有效信息。非易失性存储器(NVM)的发展为持久性内存频繁模式挖掘算法提供了机遇,但非易失性存储器的读写不对称、寿命有限等缺陷又成为了非易失性存储器完全替代动态随机存取内存(DRAM)的障碍。虽然利用频繁模式树(FP-tree)结构是进行频繁模式挖掘的有效方法,但若将频繁模式挖掘算法应用于非易失性存储器上时,FP-tree构建过程会产生许多对非易失性存储器的不必要写操作,因此会极大的影响算法性能。本文的目标是实现高性能、高能效、可持久的频繁模式挖掘,对挖掘性能、能耗和系统持久性进行联合优化。为了实现可持久、高性能的频繁模式挖掘算法,本文采用非易失性存储器作为系统内存,针对频繁模式挖掘算法以及非易失性存储器的特性,在此平台上提出基于非易失性存储器的频繁模式挖掘算法;为了增加算法的可扩展性,进一步提出基于非易失性存储器的可扩展频繁模式挖掘算法;并通过实验对比分析算法有效性。具体工作如下:第一,传统频繁模式挖掘算法会对内存产生很多读和写操作。由于非易失性存储器读写不对称且寿命有限,对其过多的写操作,会影响系统性能,还会降低存储器寿命。为此,根据非易失性存储器和频繁模式挖掘算法的特性,本文提出基于非易失性存储器的频繁模式挖掘算法,减少频繁模式挖掘算法中不必要的更新操作,达到提高算法性能,降低系统能耗,延长非易失性存储器寿命的目的。第二,待挖掘数据量的增大为频繁模式挖掘的性能带来了挑战。在本文所提出的改进优化后的频繁模式挖掘算法基础上,针对待挖掘的海量数据,本文提出并行的频繁模式挖掘算法。同时考虑非易失性存储器的缺陷问题,尽可能减少写操作次数。通过增强在非易失性存储器上频繁模式挖掘方法的可扩展性,达到进一步提升频繁模式挖掘算法性能的目的。最后,本文在Linux系统中进行模拟仿真实验,以验证所提出算法的有效性。实验结果表明,在单核系统上,与传统的频繁模式挖掘算法相比,本文提出的优化算法可以平均提升挖掘性能40.28%,平均提升存储器寿命87.20%,能耗平均降低50.30%;在多核系统上,与单核系统上运行的算法相比,本文提出的可扩展频繁模式挖掘算法挖掘性能平均提升63.67%。
其他文献
视觉显著性检测一直是计算机视觉领域中比较重要的一项技术。人类的视觉系统根据视觉信息选择关键部分进行更精细的分析与处理,人类视觉的这种机制如同一个过滤器剔除一些无
金属燃料电池(金属-空气电池)是一类具有高比能量的绿色化学电源,其空气电极的氧还原反应(ORR)催化剂对电池性能有着十分重要的影响。本论文通过密度泛函理论(DFT)计算,针对过渡金属元素Mn、Fe等,设计并筛选出了具有优异ORR催化活性的过渡金属-氮-碳(M-N-C)单原子活性位点,同时研究了N/C配位环境对金属中心d带电子结构的调控机制及其与催化活性的关联。针对优化设计的Fe-N_8活性位结构,
竹子是一种环保的可持续资源,不仅深受现代消费者的喜爱,更是自古应用于中国家具生产中。但是随着现代技术的高度发展,传统竹家具与竹编已无法适应现代需求,对其进行改良设计研究势在必行。本文通过对竹躺椅案例的人体工程学研究,将传统竹编工艺与竹家具进行融合设计及应用研究,致力于将两者进行优势互补。希望可以在保留传统手工艺的同时,拓展竹材应用方式。本研究首先对竹躺椅各部分进行了定性和定量分析。将躺椅分区后结合
通信技术在90年代末期之后进入了飞速发展的阶段,从2G到3G再发展到目前的4G,在现代的主流移动通信系统中,OFDM技术应用最为广泛,而且在众多的高速数据传输场景中有较好的表现
随着云计算、大数据等新兴技术与热点行业的发展,信息系统的建设对信息存储的可靠性和性能都有了更高的要求。以大型电信运营商为例,存储阵列在实际的高可用高可靠的应用类型
随着Internet的发展和数码相机的普及,易于编辑、修改和拷贝的数字图像获得了人们的青睐。但是,数字图像的以上特点也让图像篡改者有机可乘,他们利用视觉上的假象以达到恶意
多媒体信息的数字化转变和网络化普及无疑为人们提供了极大的便利,数字视频作为一种广受欢迎的多媒体形式发展喜人。但由于其本身的易复制性和传播迅速等特点,视频盗版侵权案
随着云计算和云存储技术的迅猛发展,将数据存放在云端逐渐受到用户的青睐。依赖单个云存储服务提供商具有提供商锁定问题、服务中断时用户数据不可用等弊端,因此多云存储的概
压缩感知(Compressed Sensing,CS)理论是近年来兴起的一种新的信号处理理论,在图像处理相关领域有着广泛的应用。CS理论将数据采集和压缩过程同步融合,降低了传统采样定理对
目前,管道SCADA系统维护工作主要以人工为主,每年的维护工作量大,效率低;而且,数据审核功能通常无法正常实施,单位之间没有形成流畅可靠的信息交流渠道,数据不一致现象时常发