面向多核可伸缩的MapReduce库的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:marymahoo1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
并行编程是有效利用多核资源的重要方式。然而,传统的并行编程模型要求程序员手动管理诸多的并发细节,使得并行编程变得困难且易错。MapReduce编程模型通过自动管理并发任务,简化并行编程。Phoenix是MapReduce模型在多核系统上的一种实现,它证明了应用程序通过使用MapReduce能够获得与Pthreads相媲美的性能。但是,Phoenix的可伸缩性较差。本文旨在分析影响Phoenix可伸缩性的关键因素,然后设计并实现一个具有较好可伸缩性的MapReduce库SMR。本文的主要贡献为:(1)通过实验测试以及使用Linux Perf等性能分析工具,深入分析影响Phoenix可伸缩性与性能的关键因素。Phoenix因Pthreads线程对共享地址空间的竞争导致其较差的可伸缩性,因map和reduce阶段间存在同步屏障影响性能。(2)利用课题组已有的新型线程模型Sthread,设计并实现一个Phoenix接口兼容且具有较好可伸缩性的MapReduce库SMR。SMR通过避免多个线程对共享地址空间的竞争,提升系统的可伸缩性;通过让map和reduce阶段间的无阻塞流水线并行,提升系统的性能。(3)在一台32核机器上使用Phoenix测试程序对SMR和Phoenix进行性能评估,还分析了近年来Linux内核的优化对多核MapReduce库可伸缩性与性能的影响。实验结果表明,基于SMR运行的五个测试用例都具有较好的可伸缩性和性能。32核CPU下,SMR相比Phoenix的性能提升为9.0倍~26.7倍。Linux内核的优化能够有效提升Phoenix的执行效率,而对于SMR的影响较小。(4)为了高效支持迭代型MapReduce应用,本文初步设计并实现了面向多核可伸缩的迭代式MapReduce库iSMR。SMR因每次迭代计算都需要重复地创建和销毁环境,浪费大量的时间,致使其无法高效地支持迭代型应用。iSMR只在处理流程的开始和结束时创建和销毁环境,并且它采用线程池复用线程,以提升迭代型应用的处理效率。本文提出的SMR为程序员提供了一种简单高效的方式使用多核资源。此外,本文关于多核MapReduce库可伸缩性的分析,对其他Pthreads程序的分析具有指导意义;关于近年来Linux内核优化的分析,对Linux的相关研究工作具有参考价值。
其他文献
芳烃/脂肪烃混合物的分离是化学工业中的重要过程,但是由于其物理和化学性质非常相似,采用传统方法分离困难。与传统的分离技术(萃取、蒸馏)相比,渗透汽化技术在经济、节能和
据悉,2019年1~11月压铸锌合金平均开工率为46.9%,12月压铸锌合金开工率预计将环比下降2.47个百分点,录得50.13%,较2018年同期增长1.84个百分点。2019年12月压铸锌合金开工率
刺五加含有多糖、黄酮和酚类成分,其中多糖类成分含量较高,具有广泛的药理活性。刺五加多糖具有抗炎、抗氧化、抗肿瘤等多种活性。本文对刺五加多糖的提取技术进行了综述,为
曲酸是一种具有多种生物活性的杂环化合物,广泛运用在食品、化妆品、医药等领域。本文综述了近几年有关曲酸衍生物生物活性研究的进展情况,而有关曲酸具有抑制酪氨酸酶活性和
女性是相对于男性存在的,反之也亦然。在社会的诸多方面关于女性的描述都是建立在巨大的男性话语权之下的。在本论文中,摒弃了男性和女性在艺术中的对立和失衡状态,单纯的从“我
通过对文献和市场调研,阐述了单克隆抗体技术的历史发展阶段、关键技术、国内外发展现状以及未来展望。
光皮木瓜是属于蔷薇科木瓜属植物木瓜的成熟果实,它是聚集药用、观赏和食用于一体的多用途类植物。光皮木瓜中含有大量的酸类物质及黄酮类活性物质,其中,酸类物质中的齐墩果
艺术教育能开发右脑潜能并使左右脑平衡发展,有助于创新酝酿和产生创造性设想,激发创新动机,为创新提供方法论原则,培养直觉力、想象力并诱发创造灵感,对创新活动和培养创新
卵泡刺激素,又称促卵泡激素(Follicle Stimulating Hormone,FSH),是脑垂体分泌的可刺激卵泡的发育成熟以及精子形成的一种糖蛋白激素。其活性形式为由α亚基和β亚基形成的异源