【摘 要】
:
随着多媒体应用的普及,越来越多的处理器集成了SIMD扩展,但是非连续或者非对齐访存会阻碍程序的向量化或者造成性能损失。针对实际应用中出现的数组引用不连续的情况,提出了
【基金项目】
:
核高基国家科技重大专项(2009ZX01036)资助
论文部分内容阅读
随着多媒体应用的普及,越来越多的处理器集成了SIMD扩展,但是非连续或者非对齐访存会阻碍程序的向量化或者造成性能损失。针对实际应用中出现的数组引用不连续的情况,提出了一种数学模型,用以刻画数组的访存模式和数据重组方案,以判断这些数组引用是否可以通过数组转置的方法满足连续性要求;并采用过程间数组填充、循环剥离和基于SLP的向量化代码生成方法等进行对齐优化。最后基于SPEC2000测试集对该算法进行了测试,结果表明,该方法可以有效地提升向量化程序的执行效率。
其他文献
针对心脏磁共振(MR)序列切片图像,设计了一种基于Radon变换和功率谱结合的图像配准算法。首先采用形态学边缘检测等图像预处理技术,提取出图像的边缘特征,并将其作为后续配准的输入;而后利用Radon变换和功率谱相结合的配准方法依次求出待配准图像的缩放、旋转和平移参数,利用这3个配准参数,即可通过配准变换得到配准结果。该方法解决了单纯利用Radon变换求解旋转参数易受图像空域噪声影响的问题,提高了配
在Egil Bae和Tai Xue-Cheng提出的图切割算法基础上,给出了一种改进算法用于求解Mumford-Shah图像分割模型。首先利用Mean Shift算法对原始图像进行过分割,基于过分割产生的小区域构造恰当的图,使得分割问题转化为求特定图的最小切割问题。数值实验结果显示,直接利用Mean Shift算法分割的效果不理想,本方法保持了与Egil Bae和Tai Xue-Cheng方法相类
随着处理器由高主频的单核处理器逐步转向片上多核处理器(CMP),计算机并行处理能力不断提升。通过分析GIS串行算法面临的性能瓶颈,利用CMP的优势,采用线程级并行处理栅格数据。
肺部疾病通常以肺结节的形式表现出来。为了对肺部疾病进行诊断治疗,需要对肺结节进行准确的检测。提出了基于局部阈值和聚类中心迭代的肺结节检测算法。首先,对肺实质图像采用局部阈值算法,提取感兴趣区域(ROIs),并且计算ROIs的形态特征、灰度特征和纹理特征;其次,结合规则、聚类中心迭代和欧式距离,对ROIs进行分类。实验结果表明,所提算法能够较好地检测出孤立性结节、低对比度结节和粘连肺壁结节。
基于经典网络可达性问题的k可达性问题对于无线网络、社交网络等新型网络具有重要意义。最新提出的王K-Reach可以快速地计算任意两个顶点之间是否存在长度小于为k的路径。注
可重构多处理器阵列上的容错技术可用来重构含有故障单元的处理器阵列,以便获得最大可用的目标阵列。现有的研究成果主要侧重于重构算法的构造,还没有涉及对重构后目标阵列的同
近几年,垃圾博客过滤成为国际上新的热点研究领域。现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性。为了解决此问题,提出一种基于组合特征的动态垃圾博客过滤算
主要研究如何从在线评论文本中挖掘产品的评价主题,并对其倾向性进行分析。首先采用一种启发式规则和共现概率统计相结合的方法识别文本集合中的名词性短语,再运用LDA模型挖