基于GPU的稀疏矩阵Cholesky分解

来源 :计算机学报 | 被引量 : 0次 | 上传用户:sadsorry11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏矩阵Cholesky分解是求解大规模稀疏线性方程组的核心算法,也是求解过程中最耗时的部分.近年来,一系列并行算法通过图形处理器(GPU)获得了显著的加速比,然而,由于访存的不规则性以及任务间的大量数据依赖关系,稀疏矩阵Cholesky分解算法在GPU上的计算效率很低.文中实现了一种新的基于GPU的稀疏矩阵Cholesky分解算法.在数据组织方面,改进了稀疏矩阵超节点数据结构,通过超节点合并和分块控制计算粒度;在计算调度方面,将稀疏矩阵Cholesky分解过程映射为一系列的数据块任务,并设计了相应的任务生成与调度算法,在满足数据依赖性的前提下提高任务的并行性.实验结果表明,该算法能够显著提高稀疏矩阵Cholesky分解算法在GPU上的实现效率,在单个GPU上获得了相对4核CPU平台2.69~3.88倍的加速比.
其他文献
智能视频监控越来越多地运用在社会各层人民的工作和生活中,其给人们带来的便捷不言而喻。在智能交通系统中,对运动车辆的检测和跟踪是整个交通事件检测和视频监控系统智能化
烟草产业是贵州省得支柱产业之一,但烟草的种植受国家指标的严格控制。由于喀斯特高原山区地貌的支离破碎以及作物种植的复杂等情况,所以很难通过传统手段实现对烟草生长状况
为进行服务组合优化及适应服务组合优化过程中Web服务的动态性、不稳定性以及多种QoS属性限制等问题,提出一种多信息素动态更新的蚁群算法MPDACO,包括MPDACO局部优化算法和MP
在经济全球化、价值多元化的当今时代,如何说服思想政治教育对象接受思想政治教育内容,增强思想政治教育说服效果,是当前思想政治教育研究中的一个难题。中国传统文化有着十
近几年,我国一些上市公司中频繁出现股东因持股变化而对公司的临时股东大会的召开、公司董事会成员的任免以及公司内部事务议案的提出等事项提出要求而造成的上市公司控制权
<正>~~
伴随城市空间向郊区的急剧扩张,郊区已成为快速城市化过程中疏解城市人口和功能的重要空间。然而,居民迁入郊区后往往会面临着与内城不同的居住环境、指向内城的长距离通勤以
针对计算机网络访问请求具有实时到达以及动态变化的特点,为了实时检测网络入侵,并且适应网络访问数据的动态变化,提出一个基于数据流的网络入侵实时检测框架。首先,将误用检
数据复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的
基于中国证券公司操作风险数据特征,运用"自上而下"的度量方法,构建中国证券公司操作风险的度量模型,采用2005~2009年中国4家上市券商季度财务报表数据和其他相关经济数据,度