基于位并行的高性能最长公共子序列算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ttcj_008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最长公共子序列(LCS)是解决在一个序列集合中(通常为两个序列)用来查找所有序列中最长子序列的问题(不改变序列顺序)。最长公共子序列问题是很多领域中的经典问题,比如计算生物学、数据挖掘、文本编辑等领域,也是数据比较程序和生物信息学应用的基础。目前的解决LCS问题的方法都是基于动态规划。随着生物序列数据库规模的不断增长,并行序列比较算法发挥越来越重要的作用。基于位并行的LCS算法,将每个字符映射为计算机字word的一个二进制位,同时可以对32个字符进行操作,减少了操作数目,达到一种细粒度的并行。虽然计算速度相对提升了一些,但是随着大数据的产生,需要处理的数据越来越多,仅仅利用CPU进行计算已跟不上数据产生的速度,利用高性能计算加速卡进行加速迫在眉睫。基于KNC、KNL加速卡的计算机集群则是发挥了更大的优势,能让我们获得更大程度的并行,取得更高的程序性能。在本论文中,我们提出了 XLCS,通过在Intel Xeon Phi集群上应用基于位操作的并行实现来加速LCS算法。我们设计了一个异步数据传输与计算框架,计算与数据传输处理同时进行,可以掩盖掉大部分的IO通信;在单节点内部,利用向量化、openmp多线程等提高算法性能,同时设计分段矩阵计算方法,减少序列换入换出缓存的频率,提高缓存命中率。在集群多节点之间,利用MPI进行多线程的通信,将集群节点分为主节点与计算节点,主节点负责数据分发预处理、结果搜集处理,计算节点负责计算,计算完成将结果返回给主节点。通过以上技术手段,充分利用分布式资源,实现在集群上对LCS算法的优化。实验性能评估表明XLCS在单一Xeon Phi 31S1P卡上获得了3.61TCUPS峰值性能,在单一 Xeon Phi 7210卡上获得了 8.20TCUPS峰值性能。与在3块M2090GPUs卡上实现的并行LCS算法OCS相比,XLCS分别在KNC平台和KNL平台取得了 3.6倍和8.1倍加速比。XLCS在天河2号超级计算机上运行16个计算节点,获得了 93.84TCUPS性能。在郑州大学的KNL集群上,XLCS使用32个计算节点,获得了 312.30TCUPS性能。据我们目前所知,这是基于位并行的LCS算法在Xeon Phi集群上的首次实现。我们可以在https://github.com/wxiaoning/LongestCommon-Subsequence 上获取到本文的XLCS源代码。
其他文献
本文研究了水平层状地层中随钻电磁波测井响应的混合法求解方法并开发出相应的计算软件。通过数值模拟结果研究考察了钻铤周围电场、磁场的空间分布,层状介质中的测井响应以
近年来,铝离子电池相关研究出现重大突破,由戴宏杰院士团队研制的铝离子电池拥有安全性高、稳定性能强且能够支持大电流充放电等一系列的优点,其在电网等大规模储能领域有着广阔的应用前景。为了满足铝离子电池的实际应用与推广需要,本文根据铝离子电池的基本特性建立了铝离子电池的等效电路模型并确立了铝离子电池的荷电状态(State of Charge,SOC)估算方法。首先,以铝离子电池为主要研究对象,综合考虑铝
开窗行为是建筑中最常见的人行为之一。研究发现人行为对建筑能耗具有十分显著的影响,也是造成建筑能耗不确定性的关键因素,开窗通风不仅能改变房间内温度和湿度的平衡以提高空气质量,又能使建筑在能源方面的消耗有所降低。然而,开窗行为受多种驱动因素影响,具有很强的不确定性,这为建筑能耗动态模拟带来了困难。寻求开窗行为驱动因素,建立准确的开窗行为模型,有助于提高建筑能耗模拟的精度。以西安地区四处不同住宅为测试对
茅苍术Atractylodes lancea(Thunb.)DC.是菊科多年生植物,其根茎具有祛风散寒、燥湿健脾、明目之功效,是临床常用中药。茅苍术主要分布于江苏、湖北和河南等省份,其中江苏茅
近年来,世界各地的新能源装机量持续升高,新能源并网容量的大幅波动性对线路的载流容量提出了更高的要求。动态增容技术以较高的经济性解决了新能源并网的难题,在世界各地得到了广泛的研究与应用。现有的动态增容方法均基于气候模型和温度模型,在原理上即存在误差较大的缺陷。为了准确测算高压架空输电线路的实际最大载流容量,本文依托于华北电力大学与广东电力科学研究院合作研发的DTRT-1型动态增容装置,利用该装置20
随着激光技术与散射谱分析技术地不断发展和进步,基于光散射技术的激光雷达被广泛应用于军事,航天,海洋探测,地质探测,气象探测等领域,并获得了重大的突破和进展。本文主要介
国内汽车市场繁荣的背后也导致了汽车保有量的逐年增加,这也严重超出城市交通基础设施的承载能力,不仅造成严重的交通拥堵现象,而且城市道路规划者平均给每辆汽车划分的车位空间也大大减小,进而车位供给的矛盾和压力也日益增大。由于实际生活中驾驶员的驾驶技能和泊车经验不同,导致泊车过程交通事故频发,而自动泊车系统作为一种新兴的智能车辆无人驾驶技术,可将其视为解决上述难题的一种优秀的解决方案,不仅提高汽车在泊车过
建筑行业作为高耗能产业,其能源消耗量约占社会能源总消耗的30%,在建筑业蓬勃发展的今天,有必要将建筑节能提上发展日程。外墙是建筑的重要结构组成,对其进行保温处理能够起到控制房间内温度、湿度的功效。在国家对建筑节能减排重视程度日益提高的今天,外墙保温材料的节能环保已经成为外墙建设中的核心考核指标之一。西北地区作为我国的一个重要的地理分区,气候干旱、温差大、风沙肆虐,对于节能保温材料的需求更为紧迫。本
无机磷是营养元素缺乏中最常见的限制植物生长发育的元素之一,自然界中植物常常会面临低磷胁迫的逆境,对此,植物会在形态上发生根系结构的变化,增加磷元素的吸收,体内磷信号通路一些转录因子被激活,调控植物的生长发育和对环境的适应性。通过转录因子之间的联系,磷信号通路和一些植物激素途径之间存在着相互作用。茉莉酸是植物内源激素,通过其信号传导网络对植物器官的生长发育,应对非生物胁迫的适应性和免疫响应也都有调控
随着科技迅速发展,现代化城镇建设的迅猛推进,浅层地质空间探测在其中扮演着越来越重要的角色,而浅地表频率域电磁探测技术因其稳定性高,探测频带宽,对探测目标无损坏等优点,