【摘 要】
:
贝叶斯网络(Bayesian network,BN)是目前不确定知识表达和推理领域最有效的理论模型之一,同时在如图像处理、疾病预测等领域得到越来越多的应用。BN结构与预测效果直接相关,学习BN结构也已被证明是NP难问题,因此快速准确的学习BN结构极为重要。启发式搜索算法已被广泛应用在BN结构学习问题中。基于遗传算法(Genetic algorithm,GA)的BN结构学习算法存在搜索时间过长、易陷
论文部分内容阅读
贝叶斯网络(Bayesian network,BN)是目前不确定知识表达和推理领域最有效的理论模型之一,同时在如图像处理、疾病预测等领域得到越来越多的应用。BN结构与预测效果直接相关,学习BN结构也已被证明是NP难问题,因此快速准确的学习BN结构极为重要。启发式搜索算法已被广泛应用在BN结构学习问题中。基于遗传算法(Genetic algorithm,GA)的BN结构学习算法存在搜索时间过长、易陷入局部最优的问题。当数据量较大时,单机算法无法在限定的时间内得到BN结构,同时当各个计算流程相对独立时部分数据的使用效率较低。本文通过对基于GA的BN结构学习算法原理进行研究,对算法在小数据量下收敛速度较慢、易陷入局部最优及大数据量情况下计算时间较长、存在冗余计算等问题进行了针对性研究,提出了一种高效的知识驱动的GA算法,同时进一步结合Spark平台提出了基于GA的全流程分布式BN结构学习算法。本文主要工作如下:(1)针对搜索空间过大所导致搜索时间较长及现有基于GA的BN结构学习算法存在的收敛速度较慢、易陷入局部最优的问题,本研究提出了一种高效的知识驱动GA以解决BN结构学习问题。本文提出的算法使用了一种新的选择算子保持种群多样性,以便学习准确率更高的BN结构,并在此选择算子中引入爬山法的思想以加快收敛速度。为了提高所提算法的局部搜索能力,提出了一种新的知识驱动突变方法,分析精英集中个体所隐含的正确BN结构信息从而引导局部搜索过程。本文在小数据量的情况下,在各类小型、中型、大型、超大型网络上进行实验。实验结果证明了所提算法中各算子的有效性,同时相比传统BN结构学习算法和新型的GA混合算法,本文所提算法在较大网络中的准确率、收敛速度、搜索效果等方面表现出优越的性能。(2)针对在海量数据情况下基于GA的BN结构学习算法执行时间较长、冗余计算较多,同时现有分布式BN结构学习算法的BN结构准确率不高的问题,本研究将混合方式的BN结构学习算法与Spark分布式计算平台结合,提出了一种基于Spark的全流程分布式GA混合算法以解决海量数据情况下的BN结构学习问题。所提算法在构建超结构、评分计算和GA的进化操作三个流程上进行了并行化工作,同时引入Redis对中间数据进行存储以便在评分计算过程中高效复用数据,减少冗余计算时间,加快计算效率。本文在不同模型的海量数据情况下进行实验,实验结果表明所提分布式算法中各个算子的有效性,在结构精度、运行时间等方面相比传统算法和其它新型分布式混合算法表现较优。本文提出的分布式BN结构学习算法为海量数据情况下的BN结构学习方法提供了新思路。
其他文献
爱尔兰动画导演汤姆·摩尔凭借其独特的美术风格与作品中所呈现的爱尔兰民族文化为世界所熟知。2009年至今,他创作了《凯尔经的秘密》、《海洋之歌》、《狼行者》等与爱尔兰民间神话传说有关的经典动画作品。他创造的故事充满着童真童趣与幻想色彩,动画作品不仅呈现出独特的视觉盛宴,还为故事增添了与之契合的儿童角色视角。作品对儿童角色的塑造,构建了观者进入爱尔兰传说故事的“眼”,为不同的角色赋予独属爱尔兰文化的印
柯尔克孜族刺绣纹样是中国传统纹样的重要组成部分,它有着深厚的历史渊源,积淀了柯尔克孜族人民自古以来的文化内涵与审美取向,这些纹样以别致的构成、绚丽的色彩、多样的工艺向人们展现了一个古老游牧民族的民俗风情、文化观念和宗教信仰,它们生命力持久,延传至今,值得更多的人去了解发掘。但随着现代文明的发展,柯尔克孜族刺绣纹样的传承也面临着新的挑战,如何将这些纹样提炼并运用于多元的设计中是设计师及艺术文化研究者
在新零售背景下的互联网体验经济时代,契合消费者所需的高效、优质体验不仅能够刺激消费者消费欲望,而且能够促使企业由“产品为导向”逐渐向“以消费者为导向”予以转变。而在5G技术的助力下,新发展起来的增强现实技术的应用为包装设计创新提供了契机,为提升包装的用户体验提供了新的思路。AR技术从根本上改变用户与包装之间的互动关系,使包装设计为产品增色,促进消费体验升级。目前,国内外关于AR交互式包装设计的理论
作为一位深谙并秉承现实主义创作精神的当代作家,弋舟以独特的文学气质和鲜明的创作风格受到了文学界的广泛关注,荣获了鲁迅文学奖等诸多奖项,体现了一定的文坛影响力。日常生活作为生命生存的意义支撑,一直是弋舟文学创作的出发点。弋舟的小说聚焦日常生活场景,探索人性的深度与广度,体察日常生活包裹下的社会变革,呈现出现代人的生存样态和心灵面貌。论文以“日常生活”为研究切入点,对弋舟小说进行文本细读,挖掘弋舟对“
4G和5G网络的到来,促成手机成为智能化服务的终端,满足人们日常生活需要,人们通过手机更好地适应着信息化社会。但手机沉迷带来的心理、生理问题也不容忽视。根据媒介系统依赖理论和负强化情绪加工理论,某种行为或物质在满足人们需求、缓解负性情绪的同时,人们也容易加强此种行为或依赖这种物质。例如,当人们从事某项工作时,往往受手机相关线索的影响,产生强烈的使用渴求,习惯性地打开手机查看相关软件信息,以弥补错失
计算机视觉作为人工智能研究中的一个重要的分支领域,其重要性不言自明,基于人类对自身相关研究的重视,视觉任务中关于人的图像的研究无疑是举足轻重的。人脸识别作为视觉任务研究中最早的子课题之一,其研究成果已经达到了很高的水平,但是它在现实的应用中往往存在很大的局限,仅仅靠人脸来识别一个完整的人并不现实,其中存在着许多难点(如拍摄的人脸图像模糊,人脸存在大范围遮挡等)。在这样的情况下,行人重识别作为一项重
目标跟踪的主要任务在于从存在噪声的观测数据中过滤出真实目标的状态并输出,在基于分布式传感器网络的多目标跟踪任务中,存在诸如目标新生、目标数目变化、目标运动呈现出非线性/非高斯特征、不同传感器观测误差差异大,且未知以及传感器具有受限观测视野等问题,使得完成稳定的多目标跟踪任务十分具有挑战。基于随机有限集的多伯努利族滤波器,如势均衡多伯努利滤波器(CBMe MBer),广义标签多伯努利滤波器(GLMB
随着互联网时代的来临,每一刻都会产生海量数据,其中文本数据以传输效率高、便捷性高、普及范围广的优势存在于各个领域中,而如何对文本数据进行快速、准确的分类是当下的热门问题。本文以新闻文本为研究对象,对相关分类算法进行研究并改进,最终验证所提出的算法能够提高文本分类准确度。1.针对传统朴素贝叶斯文本分类算法中文本特征缺乏特征权重的问题,引入更侧重特征类别间分布的互信息,并将TF-IDF与互信息相结合,
针对细粒度图像由于类间差距过小、类内差距过大、背景复杂以及姿态差异等问题目造成的分类瓶颈,本文设计了一系列基于卷积神经网络的端对端的弱监督学习分类模型,实现对细粒度图像分类精度的提高。本文主要研究焦点在于如何准确提取识别细粒度图像易混淆、难分类的特征,有效降低分类误差。具体的研究内容如下:1.基于自注意尺度变换网络的细粒度图像分类方法。为了提高网络提取特征的表现力,本章提出自注意力融合模块和多尺寸
2020年的全球公共卫生事件给全球经济带来了前所未有的冲击和挑战,但是游戏行业却迎来了超出预期的发展。疫情不断地解体和重构着人们旧有的观念和生活方式,由于游戏较低的成本和门槛,吸引了越来越多的人尝试并参与到游戏活动中,游戏不但在一定程度上释放了社会的压力,而且弥补了大众在社交方面的渴求。在所有的手游玩家中,轻手游类型玩家中一直占据着最为广阔的市场,拥有着可观的人群基数。由于轻手游较低的开发成本,各