基于概率图模型的关联规则更新方法与实现

被引量 : 0次 | 上传用户:liuliushuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则更新研究是继关联规则挖掘研究之后,又一影响深刻的数据挖掘技术。随着数据库的事务日渐增多,以及人们对关联规则支持度和置信度要求不断改变,关联规则的后期维护给研究人员提出了新的挑战。在实际应用中,挖掘出的关联规则可能会存在大量的冗余、虚假,在这种情况下,因为事务库或需求的变更而把所有的关联规则都进行更新显然是不太合理、且往往具有较大的开销。针对关联规则的后期维护问题,特别是在事务库发生变化后,如何有效地更新关联规则是本文要解决的主要问题。如果能只针对具有实用价值的关联规则进行更新,既可节约更新代价,也能满足用户实际需求。关联规则的前件和后件间蕴含着一种依赖关系,这种依赖关系的强弱由关联规则的置信度的大小来衡量,因此,建立一个能准确反映关联规则前后件依赖关系的模型,进而构建能有效进行关联规则更新的方法,具有重要的理论意义和实际价值。本文的主要工作及贡献可概括如下:·为了构建反映关联规则前后件之间依赖关系的贝叶斯网,本文针对贝叶斯网的有向无环图结构构建这一关键点和难点,利用关联规则中前后件属性间的依赖关系,给出了带有条件依赖关系的贝叶斯网结构构建算法。基于构建得到的有向无环图结构,本文通过对数据库中的历史事务数据分析,采用似然估计算法,计算贝叶斯网中各结点的条件概率表,从而得到反映关联规则前后件属性状态条件依赖关系的贝叶斯网。·概率推理是将贝叶斯网应用于实际问题的核心计算任务,考虑到本文构建的贝叶斯网结点状态较多,为保证推理的效率,本文基于一种近似采样思想,提出了贝叶斯网的近似概率推理算法,在给定的后件属性状态情形下对前件的属性状态进行预测,并以预测的各属性最优状态替换有待修正的状态,实现关联规则的更新。·采用互联网中采集到的实际事务数据,我们实现并测试了本文提出的贝叶斯网构建及推理方法,以关联规则更新后的置信度提升幅度测试了本文方法的有效性。
其他文献
我国人口老龄化现象日趋严重,老龄化问题对于所有社会来说都是一个全新问题,都没有经验可言,如何提升老年群体生活质量成为全社会关注的焦点。本文基于伦理学的视野,以生活质量提
跳频通信(FH,Frequency Hopping Communications)作为一种典型的隐蔽通信方式,由于具有抗干扰、抗截获、抗衰落能力强,易于多址组网以及与窄带系统兼容等优点,成为战术无线通信的首
华文教育是一种较为广义的概念。它包括了由中国籍华侨兴办的华侨教育和由所在国华人(具备所在国国籍)兴办的华文教育两种。就印尼的华文教育来说,在1966年以前,中国华侨是兴办印
现代企业的生产和销售都离不开运输,企业单纯依靠自己的车队进行运输,可能会影响生产和销售的进度,造成市场竞争力的下降,很对企业就转向运输外包的形式来满足自己的发展需要,有效
生物学教学中,教师的引导应建立在学生已有知识经验的基础上,既要彰显自身的主导作用,更要发挥学生的主体性;应多创设情景,让学生体验生命活动规律和科学探究过程;应适时调整预设,因
在"互联网+"时代,大学生体育学习的方式已经发生了改变,利用"互联网+体育教育"来促进大学生的体育学习已成时下所需。深入剖析当前大学生体育教学改革所面临的问题,结合大学
随着人们档案意识的逐步提升,越来越多的人关注水书档案。水书档案是水族特有的民族档案,水书档案承载着水族社会记忆,在当下研究水书档案的存续有着一定的理论意义和现实意
随着经济的发展、城市的扩建,耕地资源不足将是南昌市当前及今后发展所面临的一项难题。通过对南昌市经济技术开发区进行实地调研,从农户视角入手,开展入户问卷调查以了解农
目的了解拉萨市棘球蚴病流行现状。方法于2016年8-12月,采取分层整群随机抽样法,在拉萨市当雄、林周、尼木、墨竹工卡、达孜、曲水、堆龙德庆、城关8个县(区)抽取调查村。根
银行因为承担风险而生存和繁荣,在风险带来机遇的同时,能否有效的控制风险,使银行以较少的成本将风险事件导致的损失降到最低,关系到银行健康、稳健的发展。随着我国经济金融