【摘 要】
:
Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储
【机 构】
:
北京邮电大学网络空间安全学院,贵州大学贵州省公共大数据重点实验室
【基金项目】
:
国家重点研发计划(2017YFB0802300),贵州省科技重大专项(20183001),贵州省公共大数据重点实验室开放课题(2018BDKFJJ008,2018BDKFJJ020)
论文部分内容阅读
Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去重,以减少冗余计算。将项目与项集的映射存储到哈希结构中,避免计算候选集的支持度时多次扫描事务数据库。同时开启多个线程,并行计算候选集的支持度,从而提高Apriori算法的运行效率。在开源数据集上的实验结果表明,当数据集中事务条数以及重复事务数越多时,该算法相较于传统Aprio
其他文献
<正>11月2日,上海浦东祝桥的中国商飞基地,迎来了一个大日子——国产自主大飞机C919总装下线了!作为见证者,记者在现场感受了这个激动人心的时刻。现场,宣读了中共中央总书记
目的:探究辨证推拿手法治疗椎动脉型颈椎病对临床症状与体征及血液流变学的影响。方法:研究对象选取2016年4月-2018年4月在我院治疗的156例椎动脉型颈椎病患者,按随机数表法
数控加工技术作为当前我国制造行业发展中比较核心的一类技术,必须引起足够的重视,具体到数控加工生产过程中来看,重点提升其精度是重中之重,为了较好提升数控加工过程的精度
通过结合高校仪器设备采购流程特点,利用信息化管理思想,设计出一套使用方便、功能强大、安全性高的高校仪器设备采购管理信息系统,并对该系统结构的体系、设计与实现进行介
企业社会责任前移成为近年来研究的热点,但基于新创企业面临的两难困境,深入探究企业社会责任前移内在机理的研究稍少。本文分析了正式/非正式两种制度嵌入对新创企业公益参