基于CUDA实现MRRR算法并行

来源 :计算机科学 | 被引量 : 0次 | 上传用户:daihongjun2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MRRR(MuhipleRelativelyRobustRepresentations)算法是求解对称三对角矩阵本征值问题高效、精确的算法之一。在分析MRRR算法及CUDA(ComputeUnifiedDeviceArchitecture)并行体系结构的基础上,针对算法的可并行性,采用单指令多线程并行方式实现了基于CUDA的MRRR算法并行,并从存储结构方面优化算法。实验结果显示,与LAPACK库中串行MRRR实现相比,并行方法在保证精度的基础上获得了20倍的加速比,进而从计算精度和计算时间上说明MRRR
其他文献
差分进化算法处理复杂高维优化问题时存在收敛速度慢和精度不高的缺陷,为此提出了分区交叉差分进化算法。利用柯西分布随机数设计两个动态算子,分别生成缩放因子和交叉因子用
针对高性能计算环境监控的一般要求,分析对比现有的监控体系结构,设计了基于GMA体系结构的监控系统,详细介绍了设计中的几个关键问题,并给出了解决办法,最后实现了一个轻量级且高
提出一种利用均值漂移算法做预处理,将概率图谱与图割算法相结合的肝脏自动分割方法。该方法一方面有效利用概率图谱所代表的形状信息,并且以无参形状建模;另一方面,均值漂移算法对灰度和形状信息组成的综合信息进行过分割处理,利用过分割的区域代替单个像素参与图割算法,降低了优化算法的复杂度。实验结果表明,该方法有效结合了概率图谱和均值漂移算法的优点,提高了图割算法的精度和速度。
延长网络寿命并获得更好的监控质量是无线传感器网络成簇算法的重要性能指标。在分析现有主要成簇算法的基础上,提出了一种适应于多级能量异构传感器网络的基于相对距离的成
针对现有信息检索系统难以按查询需求处理检索文档的问题,提出了一种基于相关反馈的信息检索模型,分析了查询词分解,推导了相关反馈机制和正规化过程,并进一步阐述了文档提取
随着IP化技术的发展、调度设备的更新,多媒体调度系统比传统调度系统更加直观与人性化。因此电力调度系统也引入了软交换来开发多媒体调度系统。在深入研究CTI技术及其JTAPI标
已提出很多图分类方法。这些方法在挖掘频繁子图时,只考虑了子图的结构信息,没有考虑子图的嵌入信息。实际上,有些频繁子图挖掘算法在计算子图的支持度时,可以获得嵌入信息。
复杂网络安全事件、物联网世系追溯等新型应用为复杂事件的世系研究提出许多挑战。由于模糊时间以及状态不确定性转移等因素的存在,追溯复杂事件的世系时往往出现时间推导不
针对LTE网络已有的拥塞控制算法无法适应分布式网络拓扑和复杂的网络环境以及自身效率低、开销大等问题,分析了LTE网络无线信道质量对AODV协议性能的影响,建立了基于路径损耗
舰员作为远程支援系统的主要使用对象,是整个系统的使用核心。舰员远程支援系统由于远离大陆,离线支援是非常重要的部分。详细描述了完整的Wiki支援系统的设计需求、设计方案和