基于核独立成分分析的缺失数据下贝叶斯网络学习算法研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:liongliong471
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪是数据和信息化的时代,各类数据库和信息系统的建立提高了人类分析数据并进行决策的能力。由于数据量的急速增加,如何从大规模数据中挖掘出数据所蕴含的信息成为了一项重要的研究课题。贝叶斯网络(Bayesian Networks, BN)是一种将概率论运用于不确定性推理的工具,它是概率统计与图论相结合的一种概率图模型(Probabilistic Graphical Models)。贝叶斯网络清晰地表达了各个节点之间的因果关系,能够利用现有数据分析不确定事件发生的概率。贝叶斯网络的一大优势是可以利用先验知识进行学习。在生物实验中,由于实验技术等原因会出现缺失数据,对缺失数据处理不当会影响数据分析的结论,最简单的方法是去掉具有缺失数据的样本,但这一方法会降低数据的信息量,有可能会造成重要结果的丢失。常用的不完整数据中网络结构学习的方法需要进行反复迭代计算,需要耗费较长的时间。本文首先介绍了贝叶斯理论和贝叶斯网络的研究背景,并对贝叶斯网络的基本定义和理论进行了分析介绍。本文基于核独立成分分析(Kernel independent component analysis, KICA)的思想以及矩阵的不完全Cholesky分解的算法设计了一种贝叶斯网络结构的评分函数,该函数能够在缺失数据下直接对网络结构进行评分而避免进行补齐缺失数据的相关步骤,从而提高了计算的效率以及学习结果的可靠性。在理论分析的基础上,本文实现了这种评分函数,编写了一个基于这一评分函数的贝叶斯网络结构学习算法,并在异质深度测序数据上进行了基因表达调控网络的构建。本文的程序在读取含有缺失数据的异质深度测序数据之后,能够直接利用该数据对网络结构进行评分,并且能够根据贝叶斯等价类理论以及生物调控网络的反馈现象将学习出的有向无环图(DAG)转换为部分有向无环图(PDAG)。最后将学习结果与标准网络结构进行比较,利用Jaccard相似度衡量本文学习的网络和标准网络的相似度,证明本文提出的算法的有效性。
其他文献
随着互联网和计算机技术的不断发展,信息化建设对于石油公司的发展越来越重要。而在石油公司内部,物资管理部门是后勤保障的中心,它位于油田公司上层管理部门和基层采油厂供
学位
色彩迁移是指给定两幅图像,分别指定为源图像和目标图像,通过变换计算,将目标图像的颜色特征迁移到源图像上,同时保持源图像的形状特征不变。作为一个图像处理以及计算机视觉领域
人脸识别是当今新兴生物识别技术的一个重要部分。人脸因具有不可复制、采集方便、不需要被拍者的配合等优点,而使得人脸识别在科研领域和商业市场上有着广泛的应用前景。嵌
随着动车组的快速发展与普及,在动车组关键部件管理过程中,产生了大量的数据,产品离开关键部件生产厂家后,因为时间和空间的限制,各阶段之间存在着信息差,无法真正实现产品数
本论文以面向MES的人力资源管理系统为研究对象,以构建行之有效的人力资源管理领域架构及可复用的领域构件为研究目标,系统地进行了中小型制造企业人力资源管理特征研究、基于
近来,随着手机等便携式摄像设备的发展,涌现出海量的非专业视频,其普及度之广,已经对人们的生活产生极大影响。非专业视频往往抖动大、可观赏性不高。因此通过一定手段优化增
随着量子计算与量子信息的深入发展,量子可逆电路的应用越来越多。可逆电路实现的是一个双射的可逆逻辑函数功能。由于它的可逆计算的功能,可逆电路不仅能够应用在量子计算,它同
河流相储层在我国石油工业中占有非常重要的地位,由于其储层非均质性严重,很难对其进行定量描述。基于等时建模原则应用随机游走方法对河流相储层进行三维建模,可以充分利用
网格变形是将三维几何模型从一个动作序列变换到另一个动作序列的过程,是三维模型处理领域中的重要组成部分。网格变形技术是近年来计算机图形学中的研究热点之一,很多研究成
目标识别与跟踪技术涉及到计算机数字图像处理、模式识别以及人工智能等诸多领域,广泛应用于军事、工业、生活等各个方面。本文以起飞的飞机为目标进行研究。研究内容分为三