时间敏感数据流上的频繁项集挖掘算法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:godwin_z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率.
其他文献
供应链建模与仿真问题是当前供应链研究领域的一大热点,通过对供应链流程的建模与仿真,首先可以清晰地了解企业所在的供应链的结构、运作模式以及企业自身在供应链中的地位,
<正>几何直观是2011版义务教育数学课程标准的核心概念之一,也是新课标增加的关键词汇,愈来愈成为数学教育中关注的一个重要问题。笔者以为,在小学阶段培养学生的几何直观能
并购是资本营运活动的重要组成部分,是企业资本扩张的重要手段,也是实现资源优化配置的有效方式。然而作为一项复杂的资本运作活动,企业并购蕴含着大量风险。统计资料显示,世
随着医疗体制改革和医疗保障体制改革的不断深入,作为国家卫生服务和体制改革的一项重要政策和解决群众“看病难、看病贵”问题的突破口和重要措施,中国的社区卫生服务正从发
水具有来源广泛、安全性和难燃性等优点。水润滑轴承以水为润滑介质,可以节约大量的油料和贵重有色金属,减少传统油轴承对环境的污染,以及提高水下航行器的隐蔽性,因此开展水
现实世界中广泛存在不平衡数据,其分类问题是机器学习研究中的一个热点.多数传统分类算法假定类分布平衡或误分类代价均衡,在处理不平衡数据时,效果不够理想.文中提出一种不
现代无线通信技术的迅速发展,使得频谱资源变得日益紧张,对微波滤波器的指标要求也越来越高,比如高选择性、低损耗、低互调及低成本等,势必推动了对微波滤波器更深入的研究。
相比传统的社交网络,基于弱关系的微博类社交网络具有显著的异构特征.根据特征可以将节点分为用户(消息订阅者)和主题(消息发布者)两类,面向用户推荐其感兴趣的主题成为了该
科学研究在经历了实验科学、理论科学、计算科学阶段后,进入了数据密集型科学阶段,与之相伴的是大数据时代的到来.大数据泛指规模达到几百TB,甚至PB级的数据①,其典型的特征
生态住宅是我国当今房地产投资的热点,但目前的“生态住宅”很多只是炒作的时髦包装,有些问题亟待深入探索和研究。文章基于绿色生态住宅的内涵和特征及其水环境系统技术导则