星系分组算法并行设计与优化:SGI系统与分布式集群对比

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zhengjunzhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
星系分组作为天文物理学中的一大研究领域,对于探索星系组的形成与演化以及宇宙大尺度结构具有重大意义。Halo-based Galaxy Group Finder(HGGF)是一种有效的基于暗物质晕的星系分组算法,它根据星系的空间位置、红移、质量等多种属性对星系进行处理,形成星系组,从而为上述研究提供重要依据。然而,当前算法的OpenMP实现版本受限于其编程模型,仅能利用单个节点中提供的内存与处理器资源,这使其在大规模星系分组问题上的应用受到限制。解决这一问题的一种思路是利用具有大量CPU核心与内存资源的一致性共享内存(Coherent Shared Memory,CSM)计算机进行问题求解,然而其高昂的价格令人望而却步,同时该类型计算机对此算法的适用性也值得考量。另一种解决思路是采用多机并行,从而利用多个集群节点的资源来处理更大规模的星系分组问题并缩短执行时间。这需要对算法进行重新设计与实现,而实现此目标的一大挑战是算法中存在大量半随机性远端内存访问,在多机并行环境下会对性能造成重大影响。为克服这一难题,我们在设计中提出了邻接星系链表思想,并采用Unified Parallel C(UPC)进行程序实现。对于核代码部分,使用4,8,16节点时,相较于单节点可分别取得2.25,2.78,5.07倍加速比。同时,对于单个节点的内存需求也显著减少。此外,OpenMP版本在SGI UV 2000上的实验结果显示,受限于程序的访存特性与机器体系架构的特点,类似HGGF算法这样具有随机数据访问特征的程序,很难有效利用具有NUMA结构的CSM计算机所提供的大规模线程与内存资源以直接取得高加速比。在分布式内存集群上采用两级并行设计以更好地利用局部性原理可以使HGGF算法更加高效。
其他文献
第五代移动通信系统(the Fifth Generation Mobile Communication System,5G)提出了超密集网络(Ultra-Dense Network,UDN)的概念,通过密集部署大量的接入点(Access Point,AP)
本文以某条城际铁路跨越城市繁忙高速钢箱拱桥为工程背景,通过仿真计算、施工监控、现场试验等方法对桥梁施工全过程结构受力问题进行分析。具体研究的内容如下:(1)基于有限元软件对步履式顶推过程结构进行了安全性分析;绘制出结构关键截面下的应力与挠度时程曲线;通过现场实测,得到了结构关键位置应力与挠度的计算数值与实测数据的对比分析图;创造性地提出了一种基于BIM可视化顶推结构同步监控方法、装置与系统;(2)
近年来,科学技术不断发展进步,互联网也随之蓬勃发展。新型媒体接连产生,更新换代的速度也稳增不减。新媒体的出现拓展了当下社会公众获取外界信息的途径,人们的生活方式也在此背景下逐渐发生了变化。如何促使博物馆行业继续在融媒体时代稳步发展,成为当下文化领域迫在眉睫的重要课题。博物馆是具有社会性质的机构,和各层次的学校一样,都具有社会文化教育的功能。但与学校有所不同的是,作为教育对象广泛且类型不同的社会教育
学位
视频问答是计算机视觉和自然语言处理领域的重要问题之一。它解决的问题是根据输入的视频信息以及历史问答的文本信息,对关于视频的问题,做出准确的回答。目前大多数视频问答
微结构气体探测器广泛应用于大型物理实验的径迹室进行粒子位置探测,但是由于结构特性会发生正离子反馈现象,导致位置畸变。为了实现径迹室对粒子的高位置分辨,首要解决的问
保持问题主要研究的是两个代数系统之间以自身某种性质或者算子的某种性质作为不变量的映射。近年来,随着学者对矩阵空间或者算子代数上保持不变量的研究,如保秩问题、保谱问
拉伸塑料土工格栅是一种性能优良的土工合成材料,它具有强度高、变形小、重量轻、耐酸碱、抗老化等优点,目前被广泛应用于铁路、公路、水利、建筑等各个领域。土工格栅的加筋性能优越,对其材料本身的拉伸特性以及拉伸方法的研究具有重要现实意义。并且现行的不同规范对拉伸塑料土工格栅的测试要求不统一,不利于对试验结果的分析评价。通过试验测得的力学性能指标是产品主要的质量指标和工程应用设计的主要参数,同时对于格栅生产
在过去的几十年里,因为光波能携带角动量,这为光通信及光操控提供了全新的维度,其潜在应用引起了研究人员的极大关注。在自由空间中,携带OAM(Orbital Angular Momentum)的光波表现出螺旋状的相位波前,因而通常被称为旋涡光(Optical Vortex)。若要用圆极化平面波使米氏粒子旋转,往往需要粒子本身是各向异性、吸收性或具有双折射率,这样粒子上各处动量转移不平衡导致粒子能够自旋
无线传感器网络通常由大量散布在特定检测区域的传感器节点构成,是用于对特定数据进行收集与分析的系统。它的应用非常广泛,例如生物栖息地的环境监测,军事侦查,工业生产控制,智能家居和智慧医疗等等。一方面,传感器节点受制于功能所需和硬件限制往往伴随着有限的计算、通信以及能耗的能力。在大多数的应用场景中,传感器节点携带容量相对固定的电池并被随机地分配到传感区域。选择节能稳定可靠的数据路由协议至关重要,路由协
本文利用ANSYS软件使用有限元分析方法对铝合金激光熔覆过程中的温度场进行了模拟,研究了不同激光功率和扫描速度对激光熔覆过程中热行为的影响。文中提出了一种改进的三维有限元模型,用于研究激光熔覆Al Si10Mg合金时的热行为和组织演变。通过实验和理论计算,区分了Al Si10Mg粉末和Al Si10Mg合金的不同材料性能,为数值模拟提供了更可靠的材料参数。同时为了研究熔覆层形成过程中的熔化和凝固行