软件TLS系统的高效线程提交机制研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:hobbysh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核/众核处理器中集成的丰富计算资源为线程级猜测并行提供了契机。在过去的20年中,有数十种通过或硬件或软件或软硬件实现的线程级猜测并行机制被广泛应用,充分证明了该机制的性能潜力。但在现有的绝大多数猜测并行模型中,猜测任务以顺序提交、顺序确认的方式完成正确性检验。如果当前线程执行的猜测任务发生了回滚,则后续猜测线程执行完的任务也就无法及时提交,无论该任务与回滚任务之间是否存在相关性,后续线程也只能进行不必要的等待,这大大降低了猜测线程的执行效率,减少了猜测并行机制带来的实际性能加速。本文以HEUSPEC软件猜测并行模型为研究平台,在深入分析该模型的基本框架、开销模型和优化策略的基础上,针对顺序提交、顺序确认机制对模型性能进一步提升所带来的约束展开了相关的研究工作。主要工作及创新点如下:1)现有的TLS系统对猜测任务的确认遵循严格的顺序原则。顺序原则虽然能确保程序执行的正确性,但对在猜测执行过程中数据相关性不确定的程序而言,会因为猜测任务的回滚而产生大量不必要的等待开销,进而降低系统的计算性能。为此,本文提出了乱序提交、顺序确认的激进式任务提交缓冲区机制(Aggressive Submission Buffer,SUB),避免猜测线程在执行过程中不必要的等待,从而提高执行效率,为进一步提升HEUSPEC模型的计算性能提供契机。2)激进式任务提交缓冲区机制在程序的猜测执行过程中,因为缓冲区的存在,可以提前对多项猜测任务进行分派,对于存在确定性相关的应用程序,这种超前的任务分派会导致应用程序的回滚率上升,缓冲区越大,回滚的连锁反应越明显。为此,本文提出了跨任务取(Inter-task Fetch,ITF)和动态缓冲区调整(Dynamic Buffer Resizing,DBR)两种动态优化技术,用以在应用程序执行过程中对回滚率进行控制,使之保持在较低的水平。实验结果表明,在误猜率相同的情况下,激进式任务提交缓冲区机制能够有效缩短执行时间,提升系统性能,并且最佳性能提升达到28.32%。跨任务取优化策略能够对误猜率进行有效控制,平均降低57.47%的误猜率和提升19.77%的计算性能,而在跨任务取优化策略的基础上增加动态缓冲区调整技术,又可以进一步提升6.73%的系统性能。
其他文献
制定行之有效的教师激励机制是每所高校都应予以考虑的问题,是关系到大学教师能否实现育人功能的重要支撑。渤海大学作为一所地方高校,于2014年提出“转动课堂”教学模式,改
布鲁姆过滤器(Bloomfilter)是一种具有空间节俭、查询高效的数据结构。在无线传感网中,一种将信息加密传输的方式是,在传输的每一个节点中进行消息的加密和解密,频繁的加密和
测试是软件开发过程中的重要环节,是工业界常用的质量保障手段。为满足测试充分覆盖的要求,测试人员需要花费大量的时间和精力来设计测试用例。测试用例自动生成技术针对给定
随着经济水平的快速发展和人们消费水平的不断提升,地毯已经成为了许多家庭和企业的主要装饰品,其需求量也在与日俱增。手工地毯的制作前后需要经过十几道工序,其中枪刺植绒
特步中国大学足球啦啦队选拔赛由特步公司赞助,以五人制足球场地为竞赛平台,与大学生五人制足球比赛同时穿插进行,在音乐的伴奏下,运用花球、爵士、街舞等多种舞蹈动作,配合
如今,在网络通信技术的飞速发展的时代,多媒体通信成为互联网信息的主要传输方式。在多媒体信息中,与声音和文字信息相比,数字图像更加生动、形象,包含十分丰富的信息量。所
随着国家对3G及4G移动网络的升级改造,手机领域带来一场前所未有的技术革命,iOS,Android等智能手机操作系统的出现,近乎使传统手机遭受淘汰。智能手机的竞争也越来越激烈,大
由于智能手机的便携性,越来越多的人习惯于使用智能手机进行拍照。但是,使用智能手机进行拍照是非常耗能的。由于电池的发展没有赶上智能手机其他硬件的发展,因此能耗问题是
目前,GPGPU凭借其出色的并行计算能力,被广泛应用于科学计算和高性能计算领域。随着集成DRAM的带宽和GPGPU上计算单元的集成密度不断增加,GPGPU等众核协处理器对片上网络性能
在分布式存储领域,各行业根据各自业务特点,开发了很多适合自己领域的分布式文件系统,如HDFS、CEPH、Lustre、Haystack等。经过调研分析,我们发现它们基本都是面向大文件存储