论文部分内容阅读
随着登纳德缩放比例定律(Dennard Scaling)的失效,通过工艺细化提升处理器效能遇到了瓶颈。因而面向特定应用的专用化设计方法受到研究者的广泛重视,这类方法对应用进行定制硬件设计,牺牲通用性以换取更高的效能。在特定应用中计算结果的轻微扰动并不会影响应用的服务质量,基于近似计算的专用设计方法利用这种容错特性,使用非精确的硬件设计来实现高效能。然而实现近似计算面临着诸多挑战:可近似性与可近似程度难以量化、近似计算实现机制过于复杂且适用范围窄、近似计算方法的部署依赖于额外的支撑技术等。 为了解决上述难题,本文分别针对近似计算的高效实现机制和面向近似计算的支撑部件展开研究,并取得了如下研究成果: 1.提出了一种基于计算复用近似计算结构,在保证服务质量的前提下感知计算权重以充分利用应用容错性,提高执行效率。为了复用历史计算中的相似计算的结果,近似计算放松传统复用方法中“输入参数绝对相等”标准以充分挖掘计算复用的机会。提出的近似计算结构克服了以往的模糊计算复用方法中缺乏可近似性量化分析的问题,避免由于选取过于保守的相似度阈值而不能复用相似计算的情况。本工作首先通过线性回归的统计方法对计算区域建模以量化输入空间各参数对计算结果的影响(即输入参数的权重),进而提出了权重感知的相似度量化方法并选取相似度阈值;为了消除计算区域中的条件分支以确保相似度量化的顺利进行,本文整合了逻辑回归和线性回归技术对条件分支进行建模以预测计算区域将要进行的计算分支。实验结果表明,本文提出的近似计算结构克服了以往近似计算方法不能处理含有条件分支的计算区域的问题,在保证应用服务质量(0.1%的输出结果偏差)的前提下,相比于直接计算的模式能够减少47.6%的计算量。 2.提出了一种可变粒度的基于计算复用近似计算方法,通过选取最优的复用粒度以充分复用计算区域中局部相似的历史计算。该近似计算方法克服了以往近似方法无法进行部分计算复用的问题,提供了足够的灵活性以发现细粒度的相似计算复用机会。本工作首先改进了动态规划的算法以充分发现存在于历史计算中的相似的局部计算序列,提出了自适应确定不同计算序列的输入波动阂值的方法;基于对提取的计算序列的统计分析,本文提出了最优复用粒度的选取机制——考虑不同复用粒度下可复用计算的比例和相应的复用时延,选取最大化计算性能的粒度;在进行近似计算时,为了降低历史计算读取、计算间相似度量化和比较这三个操作的耗时,本工作提出了基于三态内容寻址存储器的模糊查询设计方法,将上述的三个操作整合到存储器查询过程中一步完成。本文采用光流法算法作为目标应用以评估提出近似计算方法,实验结果表明该近似计算方法实现了平均59.6%的加速比,比以往的近似计算方法高出了24.41%,同时提出查询机制所需的功耗开销与常用的高速缓存相当。 3.提出了一种宽动态电压范围的处理器供电系统设计方法,在整个输出电压区间内保持较高的功耗转化效率。为了满足近似计算和精确计算两种模式的电压需求,供电系统需要能够在宽动态电压范围内提供较高的转化效率。以往的供电系统设计方法在向近阂值电压区域供电时功耗转化效率较低,此时供电系统上的功耗损失极有可能抵消基于近阈值电压的近似计算所节省的功耗。针对该问题,本工作探索了宽电压范围供电系统的设计空间并分析了多种可选设计的可行性。在此基础上,本工作提出了结合片外电感式电压调整器和片上开关电容电压调整器组成供电系统的设计方法,这种方法利用了近阈值电压下片上电压调整器转化效率较高和高输出电压下片外调整器效率较高的优点进行互补。当向低输出电压区域供电时,供电电压是通过片外和片上电压调整器的两次转化得到,这使得片外和片上电压调整器均处于高转化效率的工作状态。为了利用供电系统宽电压范围的优势,本文提出了一种基于供电系统转化效率分析的的功耗管理算法,启发式地确定最优功耗配置,在功耗约束下最大化系统性能。实验证明本文提出的供电系统设计方法能够以平均70%的功耗转化效率向宽电压范围多核处理器供电,比采用片外电压调整器的方法高出了近40%,有效地降低了近阈值电压下供电系统的功耗损失。