基于量化相关模式的多值关联规则挖掘算法

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:s04325102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  多值型关联规则是布尔型关联规则的扩展,事务数据库中属性的取值不再是0或1,而是多值型或类别型,因此研究多值关联规则更具有现实意义。   课题的研究内容主要包括:   (1) 研究了多值关联规则模型,对多值关联规则挖掘的研究现状进行了深入分析,并重点研究了一些典型的挖掘算法,同时总结了这些算法存在的优势和不足。   (2) 提出一种新颖的观点量化相关模式(quantitative correlated pattern)QCP,它是基于两种核心的概念:互信息和全置信度。首先提出了标准化的互信息,然后把它应用到 QCP数据挖掘中,目的是获得属性之间的相关性。基于更为精细的颗粒性考虑,进一步采用全置信度作为质量测量的方法用来确保在特殊的量化区间的属性之间的相关性。   (3) 为了达到利用互信息和全置信度作为双重剪枝来挖掘量化相关的模式的目的,提出一种新的算法QCoMine。该算法通过考察多值属性间互信息熵和全置信度,找到具有强信息关系的属性集进而产生规则。实验表明,由于在属性层和区间层进行了剪枝,因此缩减了搜索空间,提高了算法的性能,且得到更高置信度、更有价值的规则。
其他文献
随着移动互联网技术和智能终端的发展,PC(个人电脑)在家庭中的地位越来越边缘化,但是我们不能否认PC强大的计算处理能力。为了综合利用PC的计算处理能力和智能终端的方便显示
学习矢量量化(LVQ)网络广泛应用于在模式识别和分类领域。为了使样本的分类更准确、快速,结合了电能质量综合评估的问题对 LVQ 算法进行了研究,并在此基础上提出一种改进的算法
在机器学习领域中,直接利用高维的感知数据,例如视觉语音信号等,训练学习并获得一个具有良好控制策略的决策系统仍然是一个挑战性的问题。在Deep Q-Learning Network(DQN)提
随着互联网技术的不断发展,网络给我们的日常生活带来了极大的便利。然而,随之而来的网络安全问题却变得日益严峻。恶意攻击者利用网络中存在的漏洞来入侵我们的系统,对我们
当今社会信息产业呈现日新月异的发展趋势,信息安全成为社会愈发关注和亟待解决的问题。数字签名技术作为信息安全的重要认证技术,在数字化办公和现代办公中发挥着越来越重要的
因为数字图像具有数据容量大和像素相关性强等本质特征,所以不能采用文本加密算法进行数字图像加密。混沌具有的如对初始条件的敏感性和类随机性等优良特性,和密码学中的混淆与
文本分类主要涉及文本分词、特征选取、特征权重计算、分类算法、分类性能测评等多个过程。其中,文本分类中特征选择的计算方法是文本分类中的一个重要问题,特征词的选择综合反
聋哑人与健听人用口语进行交流是十分困难的。目前,我国的书籍、报纸、电视新闻等种种传播媒介,都是以书面文字和口头语言这类形式出现的,很少有用聋哑人最为熟悉的手语来进行表
随着软件规模的不断扩大,分析和解决软件中的问题变得越来越困难。程序切片作为一种分解程序的技术,能有效地将问题简化,在软件度量、软件测试、程序验证等软件工程的许多领
随着我国医疗行业所存在问题的愈发突出,国家的十三五规划提出发展智慧医疗来实现医疗行业运营水平和服务效率的提升。目前,智慧医疗的发展还处于初期阶段,理论和产业的结合