多核处理器典型并行算法性能分析

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:wuzhigang3481
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  目前的处理器依赖于在片上集成多个处理核心来获得性能提升,以此为硬件基础的并行编程模型需要通过屏蔽底层并行实现细节,充分发挥多核优势。本文选取了Berkeley并行计算前景报告中指出的两个典型应用,高级加密算法AES和矩阵相乘Strassen算法。通过研究基于OpenMP的多核编程模型在进行典型应用加速时影响性能优化的多种因素,包括划分任务的合理性、核间通信量以及共享数据访问的解决方式等。基于OpenMP和TBB提出上述两个典型算法的并行化设计和实现,并研究和分析了在不同并行编程模型下,影响应用性能的多种因素。
其他文献
  防火墙在网络安全中起到很重要的作用,其中防火墙策略中的规则决定了网络数据包“允许”或者“拒绝”进出网络。对于大型网络来说,由于规则太多管理者很难保证其中不出现冲
  目前基因拼接软件中应用最广泛的技术是基于De Bruijn图的基因拼接算法.随着第二代基因测序仪的大量使用和基因测序在工业中的广泛应用,常常需要对长达数十亿bp长度的基
会议
  在人脸识别领域中,最近提出的快速而又简单的稀疏描述人脸识别算法(SR)能够得到很好的识别效果,但算法依然有提高的空间。为了在人脸识别中用较少的时间得到很好的识别精度
  本文研究了一种用于三维时域电磁场模拟的可扩展求解器.该求解器基于非结构网格上的非连续伽辽金方法,并利用定义在四面体上的多变量拉格朗日多项式高阶节点基对单元内的
  MIPS处理器是精简指令集(RISC)处理器中的一个重要代表,通常应用于嵌入式系统中。近年来,随着MIPS处理器性能的大幅度提升,其应用渐渐的扩展到了高性能服务器领域。龙芯3号
会议
  基于本体的案例检索系统中,由于数据库中的案例数量随着时间的推移而成倍增加,案例检索的效率不断降低。本文提出了一种多维案例检索算法DRR,该算法通过将多维空间案例点
  本文结合曙光6000全局集合通信芯片的结构特点与测试需求,为该芯片制定出了一套完整的可测试性设计(DFT)方案,包括普通扫描、实速扫描、存储器内建自测试(MBIST)、边界扫描
会议
  本文提出了一种快速分析计算化学类应用运行特征的方法,准确提供F/M(浮点计算量与内存访问的比值)和F/C(浮点计算量与网络通信量的比值)等数值结果,通过定量数据确定应用类
  网络流量的不断增长和网络攻击形式的多样性,使得网络入侵检测系统(NIDS)变得越来越复杂。基于单引擎检测的NIDS 靠辅助硬件和改进检测算法来提高处理性能,已无法适用10G
会议
  针对云计算环境中多个DAG科学工作流的可靠调度问题,提出一种考虑处理机链路通信竞争的、动态多DAG分层调度算法(CCRH).算法首先使用通信竞争模型描述处理机之间通信,然后
会议