关联规则挖掘算法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:yangyupengmei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与传统的统计、查询方法相比,数据挖掘技术涉及到多个学科,汇集了人工智能、模式识别、数据库、机器学习以及管理信息系统等学科的成果.数据挖掘是一个新兴的边缘学科,其应用领域非常广泛,并且具有良好的应用前景.本文对数据挖掘技术,尤其是关联规则数据挖掘技术进行了系统、深入地学习和分析研究,主要包括以下内容:关联规则研究与分析.在对现有关联规则文献的研究基础上,详细的介绍了关联规则的基本概念和基本性质,并且对关联规则的典型挖掘算法及其基本思想进行了归纳、分析和研究.针对本文所要解决的问题,对经典的关联规则挖掘算法-Apriori算法和FP-growth算法进行了详细分析和研究.针对提高Apriori算法效率的各种优化技术也在这里被详细地研究和讨论,为Apriori改进算法的提出和构造建立了理论上的必要性前提.Apriori改进算法的设计和分析研究.在前面几部分工作的基础上,本文提出一个Apriori的改进算法,该算法主要考虑Apriori算法中频繁项目集生成的瓶颈问题,采取了减少事务数据库扫描次数,压缩进一步迭代扫描的事务数等方法对经典算法Apriori进行改进,通过一个实例,我们给出了运用Apriori改进算法进行关联规则挖掘中发现频繁项集的过程.Apriori改进算法的试验结果.在构造基于柏松分布函数和指数分布函数的合成数据的基础上,对Apriori改进算法的性能以及与Apriori算法和FP-growth算法的比较进行了试验,并对试验结果进行了分析.
其他文献
期刊
报纸
学位
学位
期刊
报纸
期刊
期刊
报纸
期刊