基于集成学习的贝叶斯因果森林研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhangjie333666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络(Bayesian Network,简写为BN)是不确定知识表示和推理领域中最强大的概率模型之一。众所周知,从贝叶斯网络产生始起,有向无环图(DAG)一直是贝叶斯网络的结构规范。也正是因为贝叶斯网络这种独特的结构,使得贝叶斯网络被广泛的用于处理分类问题,研究人员们称之为贝叶斯网络分类器(Bayesian Network Classifier,简写为BNC)。从目前的研究情况来看,在大多数贝叶斯网络分类器的拓扑结构中,有向边仅表示了特征变量之间的条件独立性,而不能代表特征变量之间存在一定程度的因果关系。因此,即使通过训练得到的贝叶斯网络分类器在分类过程中计算的联合概率分布可以很好地拟合数据,但这仍不能使其有足够的理论依据应用于因果推理领域。为了解决这个问题,本文发现条件熵因其得天独厚的不对称性,可以很好的用来识别贝叶斯网络特征变量之间的因果关系,而这里的因果关系是之前仅靠分析特征变量之间有限的条件独立性所不能确定。为了使其更适应贝叶斯网络分类器的训练过程,本文在此基础上,进一步创新性的提出了采用启发式搜索策略构建贝叶斯因果树(Bayesian causal tree,简写为BCT)的想法,以此来充分的表示特征空间中有效的因果关系。在这样的构建方法下,本文得到的贝叶斯因果树的网络拓扑结构不仅具有高度可扩展性,还为模型在训练的过程中所识别到的因果关系赋予了数据科学的可解释性,同时又能使其对应的联合概率可以很好的拟合训练数据。除此之外,为了能够使构建的BCT识别出特征变量间的因果关系尽可能充分的涵盖特征空间中真实有效的因果关系,本文在BCT的基础上,又创新性提出采用集成学习策略构建贝叶斯因果森林(Bayesian causal forest,简写为BCF)的想法。可以说BCF是由一系列BCT组成。为了增加BCF的多样性,BCF将其所包含的每个BCT分别以不同的特征变量作为根节点,即以不同的特征变量作为起始原因节点构建贝叶斯网络。为了弥补传统贝叶斯网络不能有效识别因果关系的缺陷,BCF在构建贝叶斯网络的过程中,首次提出使用条件熵作为测度来识别贝叶斯网络中有效的因果关系。为了验证本文所提出算法(BCF)的有效性,本文从机器学习数据库(UCI)中随机选择了32个数据集进行实验。实验结果表明,不管是与单结构贝叶斯网络分类器相比(例如,CFWNB),还是和集成贝叶斯网络分类器相比(例如,WATAN,IWAODE,WAODE-MI和TAODE),BCF在分类性能上的表现要更加出色一些。甚至和一些非贝叶斯分类器相比(例如,SVM,k-NN和LR),BCF的实验结果也往往显著优于它们。
其他文献
坚持把马克思主义基本原理“同中华优秀传统文化相结合”这一新要求,是中国共产党在成立百年之际对马克思主义中国化规律认识的总结,是中国共产党对社会主义文化建设规律认识的进一步深化。此二者的结合不仅仅是对彼此发展的推动,更是共建中国特色社会主义文化事业、发展人类文明新形态的重要方法。本文首先从文明共性和理论契合两个方面指出二者结合的内在机理;其次,梳理二者结合的历史脉络,从马克思主义中国化理论成果和社会
通过梳理最新的生物质与塑料共热解技术研究进展,对共热解过程中协同效应、热重特性、动力学机理、气液固三相产物特性进行综述,归纳了生物质与塑料共热解的协同特性和优势特点,为生物质废弃物与废塑料共热解技术提供理论依据,为环境治理提供方案参考,有利于创造经济效益和生态效益,加快实现社会可持续发展的目标。
试验旨在研究噬菌体和抗菌肽对断奶仔猪生长性能、粪便微生物及血清免疫指标的影响。选取28日龄断奶仔猪168头,随机分为7组,每组4个重复,每个重复6头猪,空白对照组为基础日粮,试验组分别添加800 g/t噬菌体、800 g/t抗菌肽、400 g/t噬菌体+400 g/t抗菌肽、400 g/t噬菌体+200 g/t抗菌肽、200 g/t噬菌体+400 g/t抗菌肽和200 g/t噬菌体+200 g/t
近年来,我国小龙虾产业发展迅猛,养殖面积和产量不断创新高。小龙虾的养殖主要以稻田养殖为主,典型模式就是稻虾共作。但传统的稻虾共作模式普遍需要开挖一定面积的环沟,减少了部分水稻种植面积。针对这一问题,我们改进了一种无需开沟的新型稻虾轮作模式,上半年利用冬闲稻田养殖一季小龙虾,小龙虾养殖结束后下半年正常种植一季晚稻。本文主要结合这几年的生产经验,对该模式的一些关键技术进行系统介绍,并分析了该模式的成本
随着土耳其恰纳卡莱大桥、中国张皋过江通道以及西堠门公铁两用大桥等超大跨度桥梁的建造,桥梁风工程研究面临新的挑战。继2019年研究进展后,聚焦桥梁颤振、桥梁涡激振动和桥梁抖振等桥梁抗风设计关键问题,通过对风工程领域主流学术期刊论文的梳理,介绍和评述了2020年以来相关领域主要研究进展。
当前我国的对并购财务风险案例的分析中,研究成果众多。但是面对疫情催化下,线下实体零售收缩加剧,线上电商发展触及天花板,线上线下趋于融合,形成新零售行业,面对新兴行业想要避开进入壁垒,快速进入抢占市场,通过并购是较为快速有效的进入手段,而有关新零售行业并购的案例分析较少涉及。本文就选取苏宁易购并购家乐福中国这一典型案例,通过案例分析形式对此次并购进行财务风险分析,将并购过程拆解进行具体分析、通过科学
目的肝纤维化是一种由于反复肝损伤而导致肝组织细胞外基质过多沉积导致的疾病。缺氧损伤为肝损伤的一部分,缺氧诱导因子-1α(HIF-1α)是响应缺氧应激的关键转录因子,在肝纤维化组织和活化的肝星状细胞(HSC)表达显著增加。目前,通过对大量HIF-1α依赖性基因和信号通路的研究,确认这些基因及其通路的变化参与肝纤维化发展过程,并可能在肝纤维化发生发展过程中起关键作用。本文综述了HIF-1α相关的信号通
为了适应电力市场的发展,电力企业必须加强对智能无功补偿技术的研究,运用现代计算机技术,提高电力系统的自动化程度,减少电网在运行过程中发生的故障和其他问题。基于此,文章对智能无功补偿技术在电力自动化领域的应用进行了深入探讨,分析了电力自动化和智能无功补偿技术的基本概念、常用的无功补偿装备,以及智能无功补偿技术在电力自动化中的应用措施,为降低输电过程中的损失提供了参考。
数据挖掘已经成为现在研究的重点,在观测数据集充实的条件下,因果网络图直接地展示出了数据中相应的因果关系。但是,当所有节点之间的因果关系的充分状态得不到满足时,现有的算法就无法准确的构建出因果网络图。在现实生活中,人们没有必要掌握数据中所有节点的因果关系,寻找一些他们想要了解的因果关系更具理论性和实用性。而且,随着文档数量的快速增长,如何直观地表达众多文档中所包含的知识变得非常重要。因此,本文的主要
文化图式,作为图式理论的一个分支,是指人们感知文化现象并存在于大脑中的背景知识结构。这是一种既有文化特征又有民族特征的框架。在长期的知识积累中,文化图式会随着其特定文化特征的变化不断更新。文化图式的翻译不仅是一种语言中的信息内容在另一种语言中重写,也是一种语言中的文化内涵在另一种文化中的重构与“移植”。文化图式理论与翻译的交叉互构,为学科的融合发展提供指引,有助于传播中国文化与文明互鉴。文化总是随