多核平台上支持推测并行化的事务存储体系结构性能优化

被引量 : 0次 | 上传用户:xingyu9404
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多核平台的普及,如何利用多核加速串行应用的执行已成为学术界和工业界共同关注的热点研究问题。而传统的显式锁同步机制自身就有着高复杂性、易错性和性能保守等天然缺陷,从根本上限制了并行程序的可扩展性和编程效率,也限制了对多核资源的充分利用。为了开发更多的多核结构上可利用的线程级并行性,利用事务存储(Transactional Memory, TM)技术来解决并行程序正确性维护给并行编程带来的复杂性和对性能的制约问题,已成为学术界和工业界的共识。本文从有效开发应用中的线程级并行性入手,着眼于高效能、易编程和可兼容这三个目标,通过软硬件协同的优化方式对支持推测并行化的多核事务存储体系结构展开深入研究,使之既能提高多核芯片片上计算资源的有效利用率,又能有效降低并行编程难度,平滑移植传统应用软件。本文从线程划分和线程执行两个方面,对软硬件协同支持推测并行化的多核事务存储体系结构性能优化开展了深入系统的研究,涉及结构模型、编程模型、性能分析模型、离线剖析指导线程划分机制和在线剖析指导线程执行机制等方面的内容。主要研究内容和成果包括:(1)对两种主流线程级推测并行技术的发展趋势进行了详细而深入的调研,通过对其软硬件支持机制的分析与比较,提出了一种新型的软硬件协同支持推测并行化的多核事务存储体系结构设汁方案。该系统在线程划分中采用软件线程级推测技术思想,而在线程执行时采用硬件事务存储技术支持,并通过离线剖析和在线剖析技术来协同各种软硬件因素,达到了同时提高程序性能和降低并行编程难度的双重目标。(2)在软件线程划分方面,从简化并行编程和提高并行执行性能的优化角度出发,提出了一套线程级推测并行性的判定准则、研究方法和剖析机制,确定了利用离线剖析技术来实现基于事务存储的线程划分方案。并依据该机制设计并实现了一套线程级推测并行性离线剖析工具集OpenPro。(3)利用OpenPro工具集,对桌面应用、多媒体应用和高性能计算应用中影响线程级推测并行性的关键因素进行剖析,从应用本身并行潜能的角度进行探讨,获得了诸如单个程序仅能有效利用16核的计算资源是当前多核技术路线的拐点等一些重要认识。(4)在线程执行支持机制方面,从可扩展性好和易于硬件实现这两个优化目标出发,提出了一种支持优先级判定的基于目录的高速缓存一致性协议,并在此基础上设计和完成了一种利用运行时库机制同时支持线程级推测和事务存储语义的分布式可扩展多核事务存储处理器PTT硬件模拟器。该处理器设计突破了以往类似方案中总线等集中式结构对硬件系统可扩展性的限制,同时实现了可扩展性好和易于硬件设计实现的目标;而这套采用积极版本管理和积极检测机制的分布式硬件事务存储机制会自动维护硬件系统的一致性,极大地减少了程序员在进行并行程序设计时的繁杂工作和复杂程度。这对于普及并行程序设计,提高并行程序生产力都有着非常重要的意义。(5)提出了一种针对线程级推测并行技术的PCL性能分析模型,并依据该模型提出了将在线剖析技术引入PTT硬件模拟平台的最终优化方案。同时通过对PTT系统多种软硬件手段实现机制的分析与协同,分别从正确性、有效性和灵活可配置性三个层次对其进行了充分的评测和分析。本文的研究工作获得了如下一些重要的认识:(1)将线程级推测技术与事务存储技术结合起来,通过软硬件因素的合理协调,可以有效地开发出串行程序中潜在的线程级并行性,同时有效地降低并行编程的难度,极大地提高并行程序设计生产力。(2)在目前以传统超标量单核构造多核芯片的技术路线下,着眼于同时兼顾硬件的有效利用率和尽可能挖掘程序中固有的并行性,在加速单个串行应用时,部分依赖严重的应用(如SPEC和一些依赖严重的科学计算程序等)采用2-4核就已经足够;而多数多媒体应用和高性能计算应用采用8-16核来加速比较合适;一些特别适合的应用则可以有效利用64-128核及以上的计算资源。(3)虽然现在线程级推测并行技术在桌面应用这样一些程序中数据依赖严重的应用中效果不佳,但在部分拥有大计算量、推测线程粒度适中并且存在模糊依赖的多媒体和高性能计算应用中还是适宜采用的。线程级推测并行技术最大的优势是其兼容性与易编程性,只要在这两点上做好文章,实现多数经典应用软件到多核平台上的平滑移植,进一步解放程序员,线程级推测并行技术就会在体系结构研究中拥有重要的一席之地。本文的研究工作和结果可用于指导共享存储的多核芯片体系结构及其并行编程环境的设计,以尽可能小的并行程序设计难度、系统软件复杂性和系统硬件代价,尽可能多地从串行程序中开发出多核芯片上可利用的线程级并行性。
其他文献
由于目前的降低实体经济企业成本政策面临政策措施不聚焦实体经济等七大结构性矛盾,以致出现了降成本宏观成效显著而微观企业感受不深的问题。下一步,降低实体经济企业成本应
随着社会的发展,企业员工的需要也在发生着变化。在不同类型的企业中,企业员工的需要又是有差别的。本研究就是以K公司这个国际著名的外资企业为调查对象,利用自编的“企业员
聋哑学校相对于常规学校,教学开展起来比较困难。为了让学生得到更好的发展,就必须建立更高效的教学课堂。尤其是小学高年级数学教学,本身就比较抽象难懂,只有构建有效的数学
女性尿道综合征(Female urethral syndrome,FUS)为反复发作性的尿路刺激症侯群,临床表现为尿频、尿急、尿痛、尿量减少及耻骨及肾区的疼痛和下腹部坠胀感,而无尿道、膀胱器质性
探索番泻豆荚中番泻苷A、B的最优提取工艺及其稳定性,为扩大药源奠定基础。以番泻豆荚为原料,高效液相色谱法测定番泻苷A、B总含量为试验指标,采用单因素试验结合L9(34)正交试
异形柱结构由于具有独特的优越性,不仅受到用户和房地产开发商的青睐,同时得到了国家的大力支持。目前,在实际工程中应用的均为钢筋混凝土异形柱结构,在近20多年的研究和应用
在相当长的一段时间里,中国是东亚最先进、最强大的国家,尤其是在隋唐时期,中国的文化技术等深深影响着东亚各国。日本在唐代,不断地派出遣唐使,以此为桥梁,来吸收、消化先进
论文以说明朝鲜半岛问题的由来及实质为基本出发点,对朝鲜半岛战略地位、朝鲜半岛当前局势演变的现状进行内部和外部的因素分析,通过朝鲜半岛当前的热点问题进行分析预测朝鲜
互联网供应链金融是传统供应链金融拥抱互联网的产物,具有多元化主体结构和复杂化业务流程的特征.针对互联网供应链金融在筹资、投资和资金回收等环节暴露出的财务风险,提出
消除贫困是经济发展的首要目标。中国曾是世界上贫困人口最多的国家。改革开放后,随着经济的快速增长和扶贫开发工作的全面展开,中国的农村贫困率出现了大幅度下降,取得了空