关联规则与贝叶斯结合的因果关系提取方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:Vince6666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘已经成为现在研究的重点,在观测数据集充实的条件下,因果网络图直接地展示出了数据中相应的因果关系。但是,当所有节点之间的因果关系的充分状态得不到满足时,现有的算法就无法准确的构建出因果网络图。在现实生活中,人们没有必要掌握数据中所有节点的因果关系,寻找一些他们想要了解的因果关系更具理论性和实用性。而且,随着文档数量的快速增长,如何直观地表达众多文档中所包含的知识变得非常重要。因此,本文的主要研究内容如下:(1)针对当前主流关联规则挖掘算法在挖掘规则时,不能准确地挖掘出观测数据中的关联规则,并且在挖掘的规则中无法正确的将关联关系和因果关系区分开。因此,提出了一种基于兴趣度的因果关联关系挖掘算法(CIM-Apriori)。该算法在当前主流算法的基础上对兴趣度进行了改进,通过利用改进的兴趣度公式计算出项集之间的信息熵,然后利用信息熵进行观测数据之间规则的裁剪。可以在海量数据中更加准确地挖掘出事物之间的因果关联关系。(2)针对当前主流马尔可夫毯发现算法在提取目标节点的马尔可夫毯时,必须保证观测数据中每个节点之间的因果关系充分,但是在现实社会中我们所提取到的观测数据并不能够保证充分的因果关系。因此,提出了一种发现潜在变量的马尔可夫毯学习方法(MLV-MB)。该方法可以在含有隐性节点的观测数据中更加准确的提取出目标节点的马尔可夫毯。最后利用因果互信息和非对称信息熵选取合适的节点对局部网络结构进行扰动学习,从而获得最终的局部因果贝叶斯网络。(3)本文运用文献计量学方法从新发表的新型冠状病毒肺炎相关的论文中进行关键词的提取,对提取的关键词进行筛选并构建最终的局部因果贝叶斯网络。通过对比分析,进一步验证了构建的局部因果贝叶斯网络的准确性,并且为在文献计量学的基础上提取重要因果关联关系提供了新思路。首先对本文提出的算法依次在公共数据集上进行实验,在相同环境下,本文提出的CIM-Apriori算法可以更加准确地提取出事物之间的因果关联规则;MLV-MB算法使得马尔可夫毯提取的准确率、召回率、F1值都有提升,并且减少了扰动次数。最后利用本文提出的算法构建新型冠状病毒肺炎的局部因果贝叶斯网络,可以准确地展示出与新型冠状病毒肺炎相关的因果知识。
其他文献
针对75m铸铁机铁块装卸场地小、转运效率低、安全风险大多等问题开展研究,通过对铸铁机铁块卸装方式进行分析及优化设计,实现铸铁机铁块直接装车转运、提高了铸铁机生产效率,为全天候铸铁生产条件下高炉及铁前工序连续稳定顺行奠定基础。
坚持把马克思主义基本原理“同中华优秀传统文化相结合”这一新要求,是中国共产党在成立百年之际对马克思主义中国化规律认识的总结,是中国共产党对社会主义文化建设规律认识的进一步深化。此二者的结合不仅仅是对彼此发展的推动,更是共建中国特色社会主义文化事业、发展人类文明新形态的重要方法。本文首先从文明共性和理论契合两个方面指出二者结合的内在机理;其次,梳理二者结合的历史脉络,从马克思主义中国化理论成果和社会
通过梳理最新的生物质与塑料共热解技术研究进展,对共热解过程中协同效应、热重特性、动力学机理、气液固三相产物特性进行综述,归纳了生物质与塑料共热解的协同特性和优势特点,为生物质废弃物与废塑料共热解技术提供理论依据,为环境治理提供方案参考,有利于创造经济效益和生态效益,加快实现社会可持续发展的目标。
试验旨在研究噬菌体和抗菌肽对断奶仔猪生长性能、粪便微生物及血清免疫指标的影响。选取28日龄断奶仔猪168头,随机分为7组,每组4个重复,每个重复6头猪,空白对照组为基础日粮,试验组分别添加800 g/t噬菌体、800 g/t抗菌肽、400 g/t噬菌体+400 g/t抗菌肽、400 g/t噬菌体+200 g/t抗菌肽、200 g/t噬菌体+400 g/t抗菌肽和200 g/t噬菌体+200 g/t
近年来,我国小龙虾产业发展迅猛,养殖面积和产量不断创新高。小龙虾的养殖主要以稻田养殖为主,典型模式就是稻虾共作。但传统的稻虾共作模式普遍需要开挖一定面积的环沟,减少了部分水稻种植面积。针对这一问题,我们改进了一种无需开沟的新型稻虾轮作模式,上半年利用冬闲稻田养殖一季小龙虾,小龙虾养殖结束后下半年正常种植一季晚稻。本文主要结合这几年的生产经验,对该模式的一些关键技术进行系统介绍,并分析了该模式的成本
随着土耳其恰纳卡莱大桥、中国张皋过江通道以及西堠门公铁两用大桥等超大跨度桥梁的建造,桥梁风工程研究面临新的挑战。继2019年研究进展后,聚焦桥梁颤振、桥梁涡激振动和桥梁抖振等桥梁抗风设计关键问题,通过对风工程领域主流学术期刊论文的梳理,介绍和评述了2020年以来相关领域主要研究进展。
当前我国的对并购财务风险案例的分析中,研究成果众多。但是面对疫情催化下,线下实体零售收缩加剧,线上电商发展触及天花板,线上线下趋于融合,形成新零售行业,面对新兴行业想要避开进入壁垒,快速进入抢占市场,通过并购是较为快速有效的进入手段,而有关新零售行业并购的案例分析较少涉及。本文就选取苏宁易购并购家乐福中国这一典型案例,通过案例分析形式对此次并购进行财务风险分析,将并购过程拆解进行具体分析、通过科学
目的肝纤维化是一种由于反复肝损伤而导致肝组织细胞外基质过多沉积导致的疾病。缺氧损伤为肝损伤的一部分,缺氧诱导因子-1α(HIF-1α)是响应缺氧应激的关键转录因子,在肝纤维化组织和活化的肝星状细胞(HSC)表达显著增加。目前,通过对大量HIF-1α依赖性基因和信号通路的研究,确认这些基因及其通路的变化参与肝纤维化发展过程,并可能在肝纤维化发生发展过程中起关键作用。本文综述了HIF-1α相关的信号通
为了适应电力市场的发展,电力企业必须加强对智能无功补偿技术的研究,运用现代计算机技术,提高电力系统的自动化程度,减少电网在运行过程中发生的故障和其他问题。基于此,文章对智能无功补偿技术在电力自动化领域的应用进行了深入探讨,分析了电力自动化和智能无功补偿技术的基本概念、常用的无功补偿装备,以及智能无功补偿技术在电力自动化中的应用措施,为降低输电过程中的损失提供了参考。