TRIPS上的矩阵乘法性能分析

来源 :2010年全国高性能计算学术年会(HPC china2010) | 被引量 : 0次 | 上传用户:zsjingling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  以TRIPS为代表的分片式结构是未来通用微处理器设计的可选方案之一.TRIPS采用细粒度推测多线程的方法,极大地开发了程序运行时的片内并行性,力图为各种类型的应用提供一个统一高效的实现平台.但运行稠密数值运算时,由于数据存放位置与指令调度的不合理,TRIPS不能发挥其结构优势.本文在一个经过时钟精确性验证的TRIPS模拟器上运行小规模稠密矩阵乘法,通过调整模拟器的各种结构参数获得不同配置下的程序性能,并通过对这些实验结果的分析,得到了TRIPS执行此类应用遇到的性能瓶颈.同时,本文针对这些瓶颈提出了调整TRIPS的存储模型和改进指令调度器等优化方法,以提高运行稠密数值运算的程序性能.
其他文献
在期货商品交易市场中,农产品的价格预测是一个重要的研究方向.本文提出一种基于经验模式分解(EMD)、支持向量回归模型(SVR)与长短期记忆模型(LSTM)相互结合的农产品价格预测
5月29日,九部委《关于调整住房供应结构稳定住房价格的意见》(“国十五条”)发布之后,最为各界关注的“两个70%”,在具体落实细则上给各地留下了回旋空间,由此引发了新一轮政
工期在建筑项目施工中占据着非常重要地位,直接决定了建筑工程的成本和质量,因此进一步优化工程工期进度拥有很高的现实意义.本文通过搜集分析国内外相关研究成果,并结合工程
  近年来,计算机硬件技术获得了很大发展,尤其是大内存和多核,但算法效率并没有随着硬件技术的发展 而提高.根本原因是没有充分利用CPU 缓存以及单线程程序设计的局限.在数
会议
在影视动画分镜头设计中画面转场的应用非常广泛,段落与段落之间,镜头与镜头之间,场与场之间都存在转场的设计,画面转场能让镜头段落产生流畅、跳跃、对比、联想等效果,极大
  在网格社区环境下,用户数据可以分布在全网格范围内的各个节点,本文针对目前缺乏社区层的全局 数据管理系统的问题,从云存储的角度出发,设计并实现了一种适应于CNGrid的支持
  字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领 域的核心操作.然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算 法难以进
会议
诗歌作为一种语言高度凝练的文学艺术形式,在兼具强大的感情表达能力和丰富的思想内涵的同时还具有作者强烈的个人色彩.路易斯.塞尔努达超现实主义时期的诗篇更如此,并且由于
  并行索引技术是提高相似度检索性能的关键技术之一。结合Beowalf 并行计算集群系统的特点,提出了 一种新颖的分布式M-tree 索引结构。该索引由一系列位于计算节点的小规模
会议
  针对大规模基因数据拼接问题,提出并实现一种对数据并行预处理方法。根据基于 数据特征将数据划分问题转化为k-mer 分类问题,保证节点负载的平衡和划分的正确,采 用hash 并