PairAnalysis:一个固定内存下的相关性分析算法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:xbqd2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种相关性分析算法--PairAnalysis,它衍生于传统的关联规则算法,用于发现数据集两个属性值之间的相关性。与其他的关联规则算法相比,该算法可以使用固定容量的内存进行运算,可以适应大型数据库的要求。最后,本文使用某银行的业务数据做了实验并与Apriori进行了对比,设计了一种称之为Web图的方式来展示算法结果,结果表明该方法在显示属性值的相关性方面是实用有效的.
其他文献
本文提出了基于结构化XML文档的并行聚类算法及两种实现方案,并分别对它们进行了分析.其中所使用的S-GRACE算法是一个可以很好解决查询中数据碎片问题的串行方案,异步通信机制
随着脑部疾病(尤其是脑瘤)发生率的逐年上升,通过挖掘脑部医学图像来发现知识对辅助医生的诊断变得越来越重要.对于医生来说,确定脑部图像中是否存在可疑的患病区域ROI是很关键
会议
本文针对科学数据的特点,提出了把粗糙集理论应用于实际的科学数据属性约简的两种方法。基本上解决了决策表的不一致间题,而且提高了计算速度。但Wond等从计算复杂性的角度证明
空间聚类方法主要有划分方法和层次方法。然而,它们都经常以局部最优结束聚类过程,在实现过程中没有考虑保持群体的全局分布特性,这个缺陷大大限制了其应用范围。遗传算法(Genet
会议
关联规则挖掘是数据挖掘中的一个重要研究方向,关联规则的发现能为决策者提供有用的决策参考.由于决策者往往感兴趣的是关于某些条件的关联规则,即带约束条件的关联规则,从而促
会议
本文结合共享滑动窗口查询操作的调度优化方法和降低负载方法,提出了两种在burst环境下提高查询吞吐率的策略,均匀降载策略和小窗口准确降载策略,理论分析和实验结果均证明这两
发现频繁项目集是关联规则挖掘应用中的关键技术和步骤,目前已经提出的可用于发现频繁项目集的算法主要有两大类,一类是Apriori及其改进算法,另一类是基于FP-tree的诸多算法。本
我想谁都经历过属于人为的误操作范畴的失败或失策,但从业务管理的角度不得不对由人为误操作而造成的产品缺陷和事故灾害进行严肃的处理。若事关重大可能还要给予处分。但须
本文主要对数据网格环境下海量数据的连接操作算法进行了研究,针对网格中各结点之间网络带宽异构的特点,采取关系缩减算法、行分块传输技术和流水线并行机制来减少查询的响应
泛逻辑学是描述连续变化过程的柔性逻辑学,它里面的广义相关理论细致地刻画了逻辑变量间的各种关系,为柔性逻辑的运算奠定了基础。本文应用广义相关理论提出了一种新的关联规则