Storm平台下基于稀疏ADtree的贝叶斯网络分布式学习算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:tnzx911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用云计算技术对搜索与评分算法进行分布化是加速贝叶斯网络结构学习过程的有效方法,但需要频繁地根据分布式文件系统中的数据集计算统计信息.为了克服分布式学习贝叶斯网络的性能瓶颈,本文使用Apache Storm平台建立了基于Topology框架的贝叶斯网络分布式学习机制,并提出了基于稀疏ADtree的统计信息提取算法和状态空间搜索算法.通过使用Topology框架细粒度地分布化了贝叶斯网络结构学习算法,达到了较高的并行度.本文使用稀疏ADtree存储全局统计信息,并在各计算节点中恢复出列联表来计算评分值.本文使用真实数据集在集群上进行了性能测试实验,结果表明评分过程的时间大幅缩短,弥补了构造稀疏ADtree的时间开销.总体上,贝叶斯网络结构分布式学习的过程得到了明显加速.
其他文献
<正>《国有土地上房屋征收与补偿条例》(以下简称《征收条例》)颁布实施后,各地在成立征收与补偿机构时对于其职能、定性,遇到诸多困惑,在国有土地上房屋征收与补偿实践中,对
转基因食品在全世界引起激烈争论。了解消费者对于转基因食品的态度和接受程度 ,对于制定转基因食品的管制政策具有十分重要的作用。国外的研究使用了多种的方法估计消费者对
作为经济体系的重要组成部分,中小企业对促进我国经济发展起着重要作用。然而,随着经济全球化以及国内外竞争的日趋激烈,特别是经过全球金融危机后,中小企业面临的市场竞争压力越
在分析住宅功能的基础上,指出空间与时俱进,应满足住户的储存需求。
2010年,房地产限购令出台以后对市场交易造成了极大影响。本文认为限购令从性质上看主要是属于一种经济政策,它的内容已经构成了对《物权法》和《价格法》等法律制度的违背。
综述了近年来国内外纤维素乙醇产业化的发展现状,分析了纤维素乙醇产业化亟待解决的关键技术,并提出了纤维素乙醇产业化的发展对策。
营利性高等教育对美国高等教育发展形成一定的冲击,逐渐与非营利性高等教育形成相对复杂的客观关系结构。在繁荣发展的同时,美国营利性高等教育面临着一系列现实困难与挑战。
实践性是大学德育的本质属性,这是由人类思想理论的实践本性、德育自身的性质特点和大学生思想政治理论素质的养成规律所决定的。应该借助整体性的理论视野还原大学德育的实
本文从叙事时间、叙事角度和叙事结构三方面对<呼河传>进行了剖析,阐述了这部小说叙述模式的基本特征及艺术魅力.