基于硬件的Minimap2基因序列比对算法加速研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ciancomjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因测序技术的快速发展,高通量、长读段的三代测序技术越来越受到市场的欢迎和重视。与此同时,基因测序成本的降低和市场的扩大使得基因数据量与日俱增,给快速完成基因数据分析带来了极大的挑战。序列比对是基因数据处理流程中的第一步,也是耗时较多的一步。在众多针对三代测序数据开发的长序列比对算法中,Minimap2以其优异的性能受到生物信息学领域的广泛认可。然而,在处理海量数据时,该算法耗时问题尤为突出。因此,开展针对Minimap2的加速研究具有重大意义。本文在对Minimap2进行函数耗时分析、流程分析和算法分析的基础上,开展了对算法当中耗时较多、计算密集的拓展步骤进行硬件加速的研究。在推导出拓展比对过程中反对角线数据间的独立性以及对角线数据间的递进关系后,提出了基于脉动阵列的硬件实现方案,并进一步利用数据包间的独立性来达到任务层面的并行加速效果。在具体的硬件方案设计过程中,本文对相关算法和实现方案进行了优化。首先,在计算得分矩阵时,通过采用2 bit数据记录回溯方向来优化回溯过程的硬件实现,极大地减少了硬件资源的使用。其次,通过设计一种循环可变长的PE级联方式,有效解决了传统级联方式中计算周期和硬件资源不平衡的问题。最后,通过采用流水线技术和多通道技术,进一步提高了硬件的整体加速效果。在验证和测试过程中,实现了基于UVM验证平台的随机化验证方案,解决了定向验证过程中仿真结果与实际结果不一致的问题。在验证方案的所有功能点被覆盖后,将硬件模块部署到FPGA中,并进行不同序列长度数据的测试。测试结果表明,模块的加速效果与基因序列的长度、PE长度以及设计的通道数均有关系。在充分利用FPGA硬件资源的基础上,和单线程软件相比,本文的硬件实现方案获得了高达130倍的加速效果。总而言之,本文针对Minimap2中拓展步骤实现的硬件方案具有明显的加速效果,在基因测序数据的增长速度与分析速度差距越来越大的背景下,为未来基因数据分析流程的整体加速研究以及基因序列比对芯片的实现提供了方向和依据。
其他文献
作为能够有效提高无线通信传输效率的技术之一,多用户多入多出(MU-MIMO)技术通过在空间中构建多条独立衰落的传输信道,有潜力大幅提升Wi-Fi系统的信道容量。影响MU-MIMO传输最终性能的一个重要指标是信道矩阵的条件数:条件数越小,表明信道矢量之间的正交性越好,从而数据流之间的干扰越弱,系统的传输速率越高。然而,在实际Wi-Fi系统中,MU-MIMO传输所对应信道矩阵的条件数往往不太理想,这主
随着全球各地的交流日益增多,海洋贸易日益繁荣,海洋的复杂波浪环境也日益受到人们的关注。海洋的波浪可以分为风浪、涌浪与混合浪,不同的波浪环境对船舶运动的影响也不同。目前已经有很多学者对海洋环境中的不规则波开展了深入研究,但针对混合浪的研究较少,对船舶在混合浪下运动响应的研究也较少。但是混合浪作为风浪与涌浪叠加而成的海浪,研究其具体特性非常重要。因此本文将利用自研CFD求解器HUST-Ship,对各个
知识图谱作为当前社会人工智能发展基石,具有十分重要的作用和地位。随着数据规模和自动化技术的发展,知识图谱的规模已经得到了飞跃式的增长,但是其距离知识完备这一理想目标仍相距甚远。为了实现这一目标,链接预测任务应运而生,其旨在利用知识图谱中已有的知识推断缺失的事实,从而对知识图谱进行完善和补全。研究者们针对该任务已经做出了许多研究,近两年来基于表示学习的方法因其效率高能力强的优点获得了国内外学者的广泛
纳米药物与现代生物医学相结合为肿瘤治疗提供了广阔前景。肿瘤内复杂的微环境,例如致密的胞外基质、免疫抑制微环境等降低了肿瘤治疗的成功率。肿瘤相关巨噬细胞(Tumour associated macophages,TAMs)是肿瘤微环境(Tumor Microenvironment,TME)的关键组成部分。TAMs根据其分型的不同,分为抗肿瘤的M1型TAMs与促肿瘤的M2型TAMs,M1型TAMs参与
燃煤机组锅炉低氮燃烧技术应用后,锅炉高效燃烧所需的高温、高氧条件与低氮排放所需的低温、低氧条件之间存在着需要调和的矛盾,如何在实现控制锅炉NOx排放的同时保证锅炉高效燃烧,已成为燃煤电厂亟需解决的问题。CO作为煤粉燃烧过程关键组分,可有效反映锅炉燃烧特性,并且与燃烧过程NOx生成之间有着较强的关联性,因此CO可以作为反映锅炉燃烧状态以及NOx生成特性的重要参量。本文以国内某600 MW墙式切圆低氮
近日节律是生物体在行为和生理过程中呈现出的以24小时为周期的节律,这些节律的维持来源于近日时钟在分子层面产生的周期性振荡,且广泛存在于不同物种中,具有极高的保守性。在近日节律调控行为及生理过程中,蛋白质的翻译后修饰(如乙酰化、磷酸化等)对于节律振荡的传递和维持有着重要作用。近年来,许多新型的赖氨酸酰化修饰被发现,但是这些修饰的生理功能尚不清楚。本实验室前期结果发现丙酰化修饰在果蝇头部呈现出系统的近
随着能源与电力技术的快速发展,大量分布式新能源和负载接入电网,人们对高质量电能的需求越来越高,电能质量成为人们关注的热点。因此,作为提高电能质量的前提,研究电能质量检测和分析具有重要意义。同时,开发能够在嵌入式设备上运行的电能质量分析系统也是智能电力仪表发展的一个重要过程。文章研究了电能质量分析的相关算法,提出了一种用于对间谐波和暂态信号进行分析的混合算法和一种暂态扰动定位算法,并通过仿真实验证明
随着人工智能的蓬勃发展,机器学习作为其最基本的实现方法,已被广泛应用在各个领域,为了解决传统的机器学习的隐私安全问题和“数据孤岛”问题,联邦学习被提了出来。然而,最新的研究工作表明联邦学习仍面临数据隐私泄露风险。因此,本文研究了联邦学习中隐私保护问题及相关技术,重点关注一类用于判断给定数据是否为某模型的训练数据集的攻击——成员推测攻击并分析了其目前防御方案及其不足。对此,本文提出了两个抵御联邦学习
焚烧已经成为当前我国城市生活垃圾处理处置最主要的方式。然而焚烧过程中释放的腐蚀性物质会造成炉内受热面的腐蚀,影响锅炉的安全稳定运行。应用耐腐蚀涂层对受热面进行表面强化是缓解炉内受热面高温腐蚀的有效措施。针对复杂的炉内环境,采用不同技术和材料制备的涂层在复杂垃圾焚烧炉内环境中的适用性尚不明晰。本文选用等离子堆焊(PTA)、电弧喷涂(TWAS)及超音速火焰喷涂(HVOF)等技术制备了10种Ni Cr基
目的:低氧性肺动脉高压(hypoxic pulmonary hypertension,HPH)是一种以肺小动脉重构为主要特征的疾病,目前临床上治疗效果有限。Notch4是血管发育及血管重构的关键调控因子。既往研究表明Notch信号通路可能参与了低氧性肺高压的发病。然而,Notch4对低氧性肺高压的具体调控机制尚未研究。方法:收集Ⅲ型肺动脉高压患者肺组织,检测Notch4的蛋白水平表达。常氧及低氧环