基于SMP的线程轻化相关研究

来源 :中国科学院计算技术研究所 | 被引量 : 2次 | 上传用户:a3392919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
约50年的并行计算历程中,从处理机内部指令集并行到集群尺度上的并行,都在现有计算能力的基础上,极大的开发了计算的潜能。随着线程应用日益广泛,体系结构、编译技术、编程模型、线程库等层面都在朝向更高并行度、更细并行粒度方向发展。同时,对网络信息服务类海量并发细粒度应用而言,利用传统线程不能如期获得SMP上的加速,而随着CMP和SMT的进展,线程开销的优化更是提上了日程。为此,本文围绕优于传统Posix线程的合适的调度粒度和相应高效低开销的调度切换技术展开讨论,以提高细粒度并行下资源的有效利用率。主要工作如下:基于pthread线程全面分析与开销测试,实验定量分析出pthread线程微秒级开销下同步粒度与多处理机上性能加速的关系:在相当于线程切换开销十倍量级的同步粒度下,执行流在多处理机上很难获得有效的性能提高,进而指出细粒度并行性能一定程度上受制于线程自身开销的问题。针对细粒度并行线程开销敏感问题,提出了资源自封闭体和主动调度机制,设计并开发了独立于操作系统的高效低开销调度模块。该调度模块兼顾核心级线程真正并行、用户级线程开销小的优点,可根据应用特征进行用户级调度,有效地减少了调度和切换开销,可高效实现每秒十万次级别的切换频度。初步达成线程粒度和切换开销的轻化,克服了细粒度并行应用在多处理机上利用标准线程无法有效获得加速的弊端。此外,该调度模块实现不改变操作系统核心的情况下有效利用多处理机,可广泛适用于此类相关度不大的细粒度并行应用。进一步,利用资源自封闭体的构造和该调度模块成功改善了并行模拟器SandFox的实际性能,获得了较标准线程库pthread实现而言几倍的提高。对于建立的高密度访问Web服务器模型,由于在微秒级同步粒度情况下,有至少30%以上的开销浪费于调度切换,应用轻化手段后如期获得CPU有效利用率的大幅提高。从而为网络信息服务类海量并发细粒度应用的性能提高研究提供了新的解决思路。另外,本文还分析了Linpack、NPB等常用并行应用,试图为线程轻化作应用特征准备。作为辅助分析,编写了误差精度在5%以内的Linpack仿真模型。利用该模型获得的详细开销数据表明,Linpack等常用高性能应用不适于轻化,文末给出总结以备后续轻化工作参考。
其他文献
本文应用机群并行技术处理滑动窗口的连续查询,并行处理的方法可以提供更多的主存空间和更多的计算资源进行数据流查询处理,从而提高了数据流整体查询处理能力,有效地解决复
本文讨论限定主题的网络爬行问题.本文中给出了一个一般的网络爬行器的结构,介绍并实现了两种类型的网络爬行策略:基于内容的限定主题的爬行和基于网络拓扑结构的限定主题的
本文针对如何进行企业的全面预算管理,提出了一个可配置综合预算模型。并按照领域将企业的预算活动分为两个部分:业务预算和财务预算,从而详细区分了各预算间的关系,并由此建
本文详细研究了常见的SMT线索调度策略,针对它们的不足,提出了了一种新的SMT线索调度策略——CEstall策略。该策略能够分配给资源利用率高的线索更多的资源,同时减少流水线中
学位
本文通过对正交小波滤波器和满足线性相位的双正交小波滤波器的分析,挖掘小波滤波器属性与低比特率小波图像压缩性能之间的关系,建立评价模型,给出小波图像压缩中滤波器的构
本文采用小脑模型关节控制器神经网络(Cerebellar Model Articulation Controller NeuralNetwork,简称CMACNN)来实现色彩查找表的插值任务。本文的主要工作是研究一种基于
计算系统性能异常是指在软件运行期间,由于资源逐渐耗尽或运行错误逐渐累积所导致的计算系统性能逐渐下降,最终下降到人们所不能容忍的程度的现象。性能异常检测能根据系统资
本文以实现能够满足可穿戴计算机系统功能及性能需求的嵌入式系统为目的,对嵌入式计算机系统的构成、嵌入式CPU、现代嵌入式系统软硬件设计与早期设计差别和系统I/O接口进行
本文的研究内容为基于XML的Web信息集成系统查询分解和查询优化方法以及查询处理模块的实现,这些算法以XML为公共数据模型,根据数据源能力等特征,进行有效的查询分解和查询优