非线性规律访存操作的数据预取技术

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:xamchendehui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
编译器在静态分析方式下很难对程序的非线性规律访存操作进行正确的数据预取.但采用pro-filing技术可以得到程序运行时候的访存规律,利用这些信息可以精确地插入数据预取指令.基于strideprofiling技术,提出了新的信息收集类型strideiterative,更精确地反映程序执行时访存指令的实际行为,并结合别名分析的结果调整对同一cache行的数据预取,得到比普通数据预取更好的预取性能.安腾2上运行CPU2000的12个整型测试例子平均有8.54%的性能提升,其中mcf性能提升达到了77.87%. Compiler in the static analysis of the program is very difficult to program the non-linear access to the correct data prefetching operations.But using pro-filing technology can get the program running when the access rules, the use of these information can be accurately inserted into the data pre Fetch instruction.A new information collection type strideiterative is proposed based on strideprofiling technology to more accurately reflect the actual behavior of the fetch instruction during program execution and to adjust the prefetching of the data in the same cache line with the result of alias analysis to obtain the data stricter than normal data Prefetch better prefetching performance. The 12 integer test cases running CPU2000 on Itanium 2 average 8.54% performance improvement, of which mcf performance improvement reached 77.87%.
其他文献
中介逻辑(medium logic, ML)自建立了它的三值语义模型后,ML就被许多学者认定为三值逻辑.对于中介逻辑核心理论的中介命题逻辑系统,给出一种真值域为[0,1]的无穷值语义模型,
针对手语识别研究中训练样本缺乏,提出了一种衍生数据的方法,有效地解决了动态多数据流手语训练用样本合成问题.利用mean-shift算法可以方便、快捷地得到密度函数梯度的变化方向,从而控制衍生的方向和强度.算法同时考虑到合成样本尽可能包含非特定人的信息及其有效性,对数据所实现的变形不会被识别系统的初始化过程逆转.合成数据驱动的效果受模型的容量、合成的强度与方向影响.在多种实验环境下对驱动效果进行评估
针对CMAC神经网络学习算法存在因使用Hash编码技术而产生的实际映射空间地址碰撞问题,提出了一种基于设置权值溢出区解决地址完全碰撞问题的方法,与传统的依靠增加实际映射空
下一代网络的本质是以提供网络服务为核心的,能够支撑各国政治、经济、文化、教育、国防等各个领域全面信息化的信息基础设施,单纯基于通信功能来进行层次划分的传统网络体系
把内部扰动加到TTM密码系统之上,构建了该密码系统的新变形.然后针对该变形给定小参数的实例,考察了它们在极小秩攻击和线性化函数方程攻击下的安全性.给出了该变形不存在线性化
融合延迟分配策略是影响数据融合效率的重要因素之一,而数据融合的目的是减少数据冗余,降低网络能量消耗,延长网络生存时间.提出了一种面向网络生存时间的延迟分配算法,该算
主动数据库中规则集的可终止性判定是一个重要问题,已经成为一个研究热点.有些研究工作提出了在编译阶段运用触发图和活化图的方法解决这个问题,其中的一个关键技术就是计算主动
为了很好地保持纹理的边界结构特征,提出了一种利用人眼的视觉特性,采用不规则块、随机覆盖法和曲线最优匹配的纹理合成新方法.新方法分两个步骤:首先根据人眼的视觉特性,采用智能选择工具从样本纹理中抽取出具有明显边界特征的不规则块,然后采用随机覆盖法和曲线最优匹配法来决定如何把不规则块拷贝到目标纹理中.和已有的合成方法相比,新方法能更好地保持纹理的边界结构特征.实验表明该方法可以快速高效地合成高质量的纹元
针对闪存被擦写的次数有限的特性,基于LZ77压缩算法,采用一种基于单页压缩策略的地址映射方案,设计并实现了一个带有数据压缩功能的闪存转换层—FCTL.通过在数据写入/读出闪