基于Charm++的并行FMM实现

来源 :数据与计算发展前沿 | 被引量 : 0次 | 上传用户:wk8954642
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]为了利用Charm++的过分解与运行时迁移特性,提高FMM的并行执行效率,本文在Charm++上完成了FMM的并行实现.[方法]通过分析通信、并行任务分解、异步调用转化,采用SDAG实现了基本通信函数,并利用LPT近似策略达到了负载均衡,最终实现了并行FMM.[结果]测试结果表明,FMM的Charm++实现的计算精度与MPI实现完全相同,在千核规模上的执行速度优于MPI实现.过分解与负载均衡策略在粒子分布不均的情况下减少了10%的运行时间.[局限]目前的实现没有利用Charm++共享内存的结构,仍有优化的空间,负载均衡策略较为简单.[结论]本文给出了一个较为通用的MPI风格程序向Charm++转化的策略,并证明了Charm++的过分解与负载均衡策略对FMM有加速效果.
其他文献
[目的]在信息中心网络中,内容命名粒度是影响网络效率特别是路由查表效率中的重要因素,然而具体关系尚待研究.[方法]本文从内容命名粒度对网络名字数量的影响出发,探究不同命
[目的]本文将部分观测的网络性能数据建模为张量,借助于深度神经网络强大的特征提取能力来恢复缺失数据.[方法]与依赖于张量分解的传统张量填充不同,本文基于深度卷积自编码
[目的]以多元网络空间共存融合的思想为主线,为未来互联网架构创新探索了可能的方向.[方法]本文以多元网络标识空间的共存、多元网络形态间的互通协同、多元化服务样式的兼容
[目的]6G网络被认为是面向未来网络2030的新一代通信技术,本文旨在面向未来6G网络需求,提出一种可参考的智能化管控架构.[应用背景]该架构将集成不同类型的人工智能算法模型,
[目的]关键性能指标(Key Performance Indicator,KPI)异常检测作为互联网智能运维的基础,对快速故障发现和修复具有重要意义.[文献范围]本文重点调研国内外基于深度生成模型
[目的]针对目前车载社交网络(Vehicular Social Network,VSN)中存在的缓存冗余大、效率低等问题,提出适用于动态VSN的缓存决策策略和缓存替换策略.[文献范围]文章重点调研国
[目的]在当今的网络交互中,最常用到的是HTTP协议,并且HTTP的使用量仍在迅速增长.然而,HTTP的通常传输仍然需要基于基础的TCP/IP协议栈,这限制了其解决当前因特网上的问题的