基于数据流的频繁高效用集挖掘算法研究

来源 :兰州财经大学 | 被引量 : 0次 | 上传用户:songking99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代产生的海量数据,使得数据挖掘成为当今各行各业制定销售策略、寻找精准客户群等工作的重要手段,其中频繁项集挖掘(Frequent Itemset Mining,FIM)和高效用项集挖掘(High Utility Itemset Mining,HUIM)是数据挖掘领域中的两个重要分支。频繁项集挖掘仅关注项集在数据库中出现的次数,而高效用项集挖掘则是考虑用户偏好、重要性、利润等因素对项集“有用性”影响,因此更能满足现实中人们对事物“有用性”的要求。而随着相关研究的逐渐成熟,有学者发现单独使用频繁项集挖掘算法或高效用项集挖掘算法并不能满足某些实际场景的应用需求,因此,频繁高效用项集开始成为数据挖掘领域的研究对象。当前越来越多领域的数据在以数据流的形式产生和存在,但其具有的不同于静态数据的特性给数据挖掘工作带来了新的要求和挑战,因此针对数据流的挖掘工作也就具有了十分重要的理论意义和实践价值。本文以高效用项集挖掘研究为中心,从几个方面对研究工作进行扩展,主要包括:(1)针对FHM(Fast High-utility Mining)算法中EUCS(Estimated Utility Co-occurrence Structure)的不足之处,提出一种改进的EUCS和相应的高效用项集挖掘算法i FHM(improved FHM)。改进的EUCS中存储的是更紧凑的效用约束上界——子树效用(Sub-tree Utility),同使只保留满足效用约束条件的子树效用值,使得挖掘效率有一定程度的提升。(2)为克服单独使用频繁项集挖掘算法或高效用项集挖掘算法的局限性,在i FHM算法中构建一个新结构ESCS(Estimated Support Co-occurrence Structure)存储所有2-项集的支持度,提出一个数据流频繁高效用项集挖掘算法i FHMS-SW(improved FHM with Support Based on Sliding Window)。该算法利用EUCS和ESCS找出既频繁又高效用的项集,并使用Storm中的事务滑动窗口机制实现了对数据流的增量挖掘,实验结果证明了该算法的有效性。
其他文献
光学相干断层扫描成像(Optical Coherence Tomography,OCT)和高光谱成像(Hyperspectral Imaging,HSI)是两种新型的生物医学光学成像技术,可以实现对在体生物组织的无损成像,
超快光纤激光器的快速发展与可饱和吸收体(SAs)密切相关,利用二维材料制成可饱和吸收体应用在光纤激光器中,已成为当下最受欢迎的实现超短脉冲的方式之一。新型二维材料主要包
架空输电线路的覆冰监测一直是保障电网安全运行的重要课题。2008年和2018年的两次严重冰冻灾害天气给全国的架空输电线路带来了严重的覆冰灾害,主要原因之一是由于架空输电
高压细水雾灭火系统替代卤代烷等传统灭火剂,被广泛应用于船舶火灾的消防与控制中。油池火作为船舶机舱火灾重要火源类型之一,高压常规细水雾会强化油池火燃烧,引发火焰蔓延,同时其布置空间大、安装成本高等特点,一定程度上降低了控制船舶火灾有效性。为进一步提高细水雾在船舶消防中的适用性,本文针对高压细水雾系统的不足,以低压细水雾为基础,研究含KCl、NaCl、CaCl_2细水雾抑制油池火的性能,对船舶低压细水
光学相干层析成像(Optical Coherence Tomography,OCT)是一种利用光学低相干干涉原理来对组织内部结构进行成像的技术。OCT技术凭借着其高分辨率、在体、无损和高灵敏度等特
近年来,有机发光二极管(OLEDs)的性能已经得到较大提高,并且有部分OLED产品开始商业化。但是,要想在未来完全取代无机发光二极管(LED),白光有机发光二极管(WOLEDs)还需在诸多
同一振动状态的光子组成的曲面称为波阵面,在某一时刻,光源发出的波阵面称为波前。光波波前中携带着与物体内部折射率、密度或表面轮廓等相关的重要信息,波前检测就是一种可
土壤盐渍化已成为制约灌溉农业发展的重要因素之一,因此,准确快速获取土壤盐渍化信息对现代农业的可持续发展具有重大意义。遥感技术因其无损、高效等特点,可以对土壤状况进
随着现代电子信息工业的蓬勃发展,微惯性测量单元作为导航技术的关键部件,在民用、工业和军工上有着越来越重要的价值与意义。微惯性测量单元中微加速度计与微陀螺需要不同的
随着经济的发展和城市化进程的推进,我国各大城市构建了大量人工湖和人工河道等景观水体,这些景观水域已成为城市居民观光、休闲的理想场所。景观水体通常具有水动力条件差和水环境容量小的特点,污染物一旦进入景观水体将极有可能造成景观水体生态环境的恶化,例如水体黑臭和水体富营养化问题。磷是造成水体富营养化的关键营养元素之一,景观水体的磷主要来源于外源磷的输入和底泥内源磷的释放。底泥通常是水体污染物的重要归趋,