面向典型优化求解算法的异构并行加速技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:talisa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
优化问题伴随着管理决策科学不断发展。一些经典的最优化理论开创了优化理论研究的先河,科学地描绘了最优解的特征。但是,直到有了计算机,人们才能够对各类较大规模的优化问题利用计算机实施求解,从而使对最优化问题的求解成为在实际生活中进行决策、管理中的有效工具。而随着计算机体系结构和各种新型架构的发展,各种异构体系结构产生的运算能力越来越强。如何利用巨大的算力、利用并行加速技术,有效提升优化问题的求解性能,成为了当前研究者们关注的重点之一。在本课题中,本文对两种具有代表性的优化问题及其求解算法进行了并行加速技术的研究。在生物信息学领域中,PairHMM前向算法在寻找基因组序列的最佳比对结果方面,在多种不同的生物序列分析工具中都非常流行。它是基因组序列比对任务中应用最为普遍的一类动态规划算法。在交通网络领域,对于起点-目的地(OD)流量的估计十分重要。针对流量估计问题,研究者提出了一种新的线性正向模型,其中包含着对多目标的迭代优化问题。如何通过并行优化技术对这两类优化问题进行加速,是实际运用中亟待解决的应用问题之一。首先,本文研究了相关优化问题以及并行优化技术的发展及成果。第二,本文利用Open MP工具、负载均衡等方法对PairHMM前向算法进行了基本的优化,最后给出了算法的性能提升情况,目的是为进一步在FPGA平台进行算法的并行加速器设计提供基本的比较。第三,本文设计并实现了一种基于现场可编程门阵列平台的PairHMM前向算法加速器。该加速器采用非协作结构以组织处理单元,并采用任务级并行方案。本文设计了非合作处理单元来独立完成PairHMM前向算法的计算。此外,基于非合作PE结构,本文为加速器设计了一种新的链式拓扑。实验表明,本文的新拓扑结构进一步地提升了PairHMM前向算法加速器的性能,性能最高提升20%。最后,对于网络流量估计问题中的线性前向模型,本文通过对其进行压缩并提出了进一步的改进模型,实现了对这个应用的加速。本文将原始模型中的带有非线性约束的多变量优化问题转化为一个标准的带约束二次规划问题。通过模型层面的优化,本文的改进模型达到了1.13倍的加速比。进一步地,通过算法选择和实现层面的优化,与之前的模型相比,本文实现了最大加速比达到了49.78倍。
其他文献
数据驱动的深度学习方法因其强大的特征提取能力已经被广泛用于雷达自动目标识别的研究。深度学习能够自动从大量的训练样本中学习数据的特征。与传统的机器学习方法相比,深度学习有更强的提取目标的语义特征的能力,在识别任务中通常有更好的性能。但通常情况下,有标签的雷达数据比较少,不能满足深度学习的训练要求,会导致严重的过拟合现象。此外,雷达传感器容易受到噪声的干扰,雷达回波受其与目标之间的相对角度以及相对位移
随着深度学习的不断发展,基于深度神经网络的应用越来越广泛,并在很多应用领域上取得巨大成功。但是,由于神经网络模型尚缺乏合理的可解释性,导致基于神经网络的系统在安全性和可靠性保障上面临巨大挑战。鲁棒性(Robustness)是衡量神经网络模型安全性和可靠性的重要属性。当前研究重点关注的是神经网络的局部(Local)鲁棒性,即神经网络模型N在给定样本x0以及扰动范围δ的前提下,样本空间中满足‖x-xo
以高速磁浮列车主动导向系统为研究对象,在建立基于搭接结构的导向系统数学模型的基础上进行控制器设计与仿真实验。针对导向系统在列车实际运行过程中可能出现的电磁铁故障和传感器故障以及端部涡流问题展开容错控制方面的研究。主要内容如下:1、在分析导向系统的结构组成、工作原理及控制方案的基础上,建立了导向系统的标称数学模型。并把系统可能受到的扰动和发生的故障考虑到其中,建立导向系统的故障模型。2、采用线性二次
随着互联网的飞速发展,用户、企业、运营商和政府对网络的要求也越来越高,这其中既包含了对服务质量的高要求,也包含了对网络安全的高要求。大量测量机构对互联网展开了大规模的测量,得到了海量的测量数据,这些数据中隐藏着互联网的拓扑结构、连通特性、基础设施运行状态等等诸多信息,研究者通过对这些信息的挖掘与分析,为网络建设和网络安全提供帮助。与此同时,也有很多研究者利用这些数据对互联网协议、路由等展开研究,以
作为众多深度学习中最热门的算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机诸多应用中都取得了很大的成功,广泛应用于语音识别、图像分割、图像识别等领域。为了提高网络性能,网络层数和规模逐渐增加。但是,简单地依靠网络层数增加的方式遭遇到了瓶颈,因此一些新型卷积神经网络相继被提出,比如反卷积神经网络和复杂连接的卷积神经网络。这些网络模型的结构更加复杂,
多智能体系统是分布式人工智能的一个重要分支,在无人系统协同、资源管理、队形控制等领域有着广泛的应用。近年来,深度强化学习被应用于多智能体领域,在应对动态开放环境、知识可迁移等方面表现出显著优势。然而,当前多智能体深度强化学习方法在应用中也存在如下问题:(1)训练过程中的过时经验问题。深度强化学习的训练依赖历史经验,然而在多智能体场景下,所有智能体的行为策略都在动态进化,使得单个智能体经验回放池中的
石墨烯作为最薄的二维材料之一,具有硅等传统材料无法比拟的优越特性,超高的杨氏模量与载流子迁移率、优良的压阻效应使其在压力传感领域拥有广阔的应用前景。现有研究已实现压阻式悬浮石墨烯薄膜压力传感器制备并达到了较高的灵敏度。然而,已有石墨烯压力传感器存在理论模型指导不准确、器件成品率低、受温度影响大等问题。针对这些问题,本文主要研究悬浮石墨烯薄膜压力传感器优化设计方法,包括改进传统压阻效应模型,并将其用
网络测量算法是网络应用的基础,在计算机网络中扮演着十分重要的作用。在大数据、云计算背景下,网络流量大幅增长,传统的网络测量算法都是在控制平面内基于CPU采样实现的,准确性低。软件定义网络的提出为网络测量算法提供了新的思路。软件定义网络提供的可编程数据平面使得网络硬件的报文处理功能可以通过软件的方式定义,用户可以灵活地在数据平面内进行编程,将网络报文的转发与网络测量任务结合起来。可编程数据平面高吞吐
随着网络化的高速推进、移动端的快速普及、以及用户之间频繁的信息交互,信息冗余现象渐渐引起了很多研究人员的关注。一方面,重复的信息分享与转发行为降低了用户使用平台的体验感;但另一方面,用户之间的同伴影响和社会强化效应也为信息扩散和影响力最大化提供了可能。本文聚焦在线社交平台中的信息重复发布(冗余)现象,关注信息传播过程中产生的覆盖与强化效应,主要开展了以下工作:(1)详细描述了在线社交网络中的信息冗
近年来,各类社交网络不断发展,它为人们复制了现实社会关系,拓展了人际交往范围,带来了丰富的娱乐体验,被普遍应用在工作和生活的方方面面。我们越来越倾向于在社交网络上享受各种服务,然而随之出现的各类数据泄露事件却让我们对个人隐私感到忧虑。本文研究分析了社交网络中的隐私保护机,对以下几个方面进行改进:(1)结合IPFS文件系统,对社交网络数据进行去中心化存储。现在服务商使用中心服务器管理社交网络的运行,