曙光1000上矩阵乘积算法的性能分析

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:lwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵乘积算法在科学计算中应用十分广泛.文中给出了典型矩阵乘积算法在曙光1000上的性能比较和分析,并针对SUMMA算法研究了分块尺寸对其通信性能的影响,指出分块尺寸是影响其通信性能的一个重要因素.原算法并没有给出其分块尺寸的具体选取方法,文中通过理论和实验的分析提出了一个选取最优分块尺寸的标准.实验结果显示SUMMA算法按文中的标准选取最优分块尺寸后性能得到大幅度提高,可达机器峰值的50.7%. Matrix product algorithm is widely used in scientific computing. The performance comparison and analysis of the typical matrix product algorithm on Dawning 1000 are given in this paper. The influence of block size on its communication performance is studied for SUMMA algorithm. It is pointed out that the size of block is an important factor affecting the communication performance. The original algorithm does not give a specific selection method for its block size. In this paper, a criterion for selecting the optimal block size is proposed through theoretical and experimental analysis. The experimental results show that the performance of SUMMA algorithm can be greatly improved by selecting the optimal block size according to the standard in the paper, up to 50.7% of the peak value of the machine.
其他文献
2009年11月国务院发布了《关于加快发展旅游业的意见》,明确提出“要把旅游业培育成国民经济的战略性支柱产业”。与此同时,为应对全球气候变暖,我国政府把低碳发展作为经济社会
该文对资产证券化原理进行了详细的阐述,分析了资产证券化的操作流程,模式选择,结构设计、规范及其优越性,在此基础上,提出了资产证券化在中国运用的可行性分析和具体的运用
对33个薄壳山核桃无性系的6个树体性状指标进行比较分析、相关分析,树形分类以及薄壳山核桃在园林中的应用阐述。结果表明:地径、胸径、树高、冠高、冠幅在无性系间、无性系
性能评价在计算机系统的选型、改进与设计中是至关重要的.使用模拟模型和队列解析模型可对计算机系统的性能进行分析.但是构造和使用模拟模型的费用较高.而队列解析模型又要求对
期刊
截面相依数据普遍存在于经济、管理领域,然而,这些领域的研究长时间忽略数据的截面相依结构。忽略数据的截面相依会导致模型的错误设置和错误结论。直到最近,作为对截面相依结构
该文首先通过对风险投资的定义、特点、作用及国内外风险投资的理论与实践的阐述,力图对风险投资的基本理论有一个比较清楚的认识.其次,对风险投资的基本运作机制进行了阐述,
该文通过理论的阐述,结合有关事例和数据,研究了公司控制权的变迁、特点及公司治理的作用机制,探讨了公司控制权安排的原则,旨在通过构造和谐的权力结构,实现公司的运营效率
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
该文首先阐述了世界经济全球化信息化趋势、贸易区域集团化趋势、世界市场高科技竞争加剧趋势等当代世界经济和国际贸易的新特征,提出应高瞻远瞩,以经济全球化大背景来制定中
该文旨在通过对经历着巨大变革的国内结算业务市场的研究,探讨邮政汇兑业务的发展战略,使其能够把握迅速增长的结算市场提供的商业机会.