基因序列全比较问题的数据分发机制研究

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:rdx200901as
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算时代的到来,为大数据处理技术提供了良好的计算场景,同时为生命科学的研究提供了强大的技术保障。基因序列比对是研究生命科学的有效手段,因此推进基因序列比对的研究具有重要的现实意义。全比较问题是对多序列比对工作中的数据文件与比较任务搭配问题的抽象,是一个数据分发策略的制定过程。然而,全比较问题不仅仅存在于基因序列比对工作中,还广泛出现在生物信息学的其它分支学科、生物测定学、机器学习、网络工程等领域。本文首先调研并分析了现有的全比较数据分发策略,包括传统的全量分发方式、基于Hadoop的数据分发策略、基于全比较数据分发算法等方式。针对现有全比较数据分发策略存在的浪费存储空间、无法实现完全的数据本地化、计算速度慢等不足,提出了两个开创性的全比较数据分发策略。本文的主要工作如下:(1)调研了全比较问题的应用领域和主流的全比较数据分发方法,简单地介绍了常用的智能算法与Hadoop。(2)构建了全比较数据分发数学模型。对全比较数据分发问题进行了形式化描述,构建了负载均衡数学模型和存储优化数学模型。(3)提出了基于粒子群优化的全比较数据分发模型(DDBPSO模型)。根据全比较数据分发数学模型,设计了基于粒子群优化实现负载均衡的数据分发算法与基于粒子群优化实现最优化存储的数据分发算法,并在Matlab平台上实现了相关算法。通过开展基于Hadoop数据分发对比实验,证明了基于粒子群优化的全比较数据分发模型具有负载均衡、优化存储的能力,同时能让所有全比较任务所需的文件具有数据本地性。与基于分支定界法的数据分发算法相比,基于粒子群优化的全比较数据分发模型具有较快的求解速度。(4)提出了基于禁忌搜索优化的全比较数据分发模型(DDBTS模型)。首先,构建了基于禁忌搜索优化的全比较数据分发策略求解框架。针对禁忌搜索算法设计出了一系列的改进方案:在负载均衡求解阶段提出了正向任务调度规则,在存储优化求解阶段提出了异节点任务互换规则等。通过存储优化实验,证明了基于禁忌搜索优化的全比较数据分发模型具有40%-50%的存储节约性能。除此之外,该模型还具备负载均衡、数据完全本地化、求解效率最高等特性。
其他文献
近年来,一些恐怖分子和极端势力经常在火车站、飞机场等人流密集的地方开展恐怖袭击活动,给人民的生命健康和财产安全带来巨大损失。金属探测器、X光安检仪等传统的安检手段在检测物品的种类,乘客隐私的保护,安检通行的效率等方面存在或多或少的问题。随着毫米波集成器件和高性能处理器的大力发展,一种基于毫米波三维成像的安检技术逐渐进入人们的视野,成为安检领域研究的热点。传统的近场毫米波三维成像算法在Nyquist
弧形阵列SAR(Synthetic Aperture Radar,简称SAR)是一种广域观测的新体制微波成像系统,将其应用于直升机平台上,能够实现对平台周围地形信息的全方位、短重访周期的成像感知。为了更充分地发挥弧形阵列雷达的潜力与效能,有必要对弧形阵列雷达的应用模式进行探索和研究。双基合成孔径雷达(Bistatic SAR,简称Bi-SAR)指的是收发分置的SAR系统,具有隐蔽性较好、抗干扰能力
随着社会经济的不断进步,人民生活水平逐渐提升,城市私家车保有量也在逐年稳步攀升。由机动车保有量上涨引发的交通需求与道路有限通行能力之间的不平衡关系日渐严重,最终以交通拥堵的形式呈现在我国的各个城市道路中。目前,交通拥堵问题在我国众多城市道路中日趋严重,频繁的拥堵不仅导致出行时间延误,而且加剧车辆污染排放。道路拥堵问题的治理关键是提前预测到可能出现的交通堵塞现象,并对各种拥堵情况发出预警信号,提前采
土壤与人类的生存和社会的可持续发展密切相关,土壤中所有的元素含量的参数都决定了植物的生命。土壤跟江河湖泊一样有一定的自我净化能力,但净化能力是相对而言的,超过了一定的限度,就很难恢复到原有的稳定状态,像土壤利用过度、盐渍化、化工污染等。本论文从土壤的盐分含量展开研究,土壤中盐分浓度过高会导致植物不能以正常的形态生长,破坏了它原本的生理参数和结构,不利于其生长和营养的吸收,从而影响区域的经济发展和生
Ti-6Al-4V(TC4)合金是钛合金家族用途非常广泛的一种材料,具有冲击韧性高、弹性模量低、耐腐蚀等优点。随着工业社会的不断发展,人们对材料构件的大小、形状有了更加精密、复杂的要求,传统的减材制造技术较难实现此目标,以激光选区熔化(Selective Laser Melting,SLM)为代表的增材制造技术完美地解决了这些难题。本文以激光选区熔化沉积态和退火态的TC4合金为研究对象,通过纳米压
葵花籽在种植、生产和保存过程中容易出现生芽、发热、霉变、发生虫害等。为了准确有效识别葵花籽霉变和虫蚀区域,提供霉变和虫蚀葵花籽识别的理论支持,研究基于机器视觉的葵花籽霉变和虫蚀识别方法,对提高葵花籽生产品质具有重要的实际意义。本文以霉变葵花籽和虫蚀葵花籽为研究对象,研究识别霉变和虫蚀葵花籽的方法。在巴彦淖尔市采取葵花籽,通过去除杂质(如土、叶子等)筛选出霉变和虫蚀葵花籽。使用智能手机对霉变和虫蚀葵
自然场景中的文字是人工智能体认知环境的重要信息来源。对自然场景中的文本自主进行检测是人工智能体应具备的基础功能,也对具有自主感知环境和自主学习能力的智能体的应用具有重要的意义,将文字从自然场景中检测出来并依据场景环境和文字内容,推理有效信息是自主智能体适应环境和自主学习的基础。近年来,自然场景中的文字检测是机器视觉发展的关键点,文字检测技术也从原始的传统方法发展到现在以深度学习为主流方法,依靠区域
作为我国畜牧业养殖基地与重要的牛羊肉生产基地,内蒙古承担着供应全国牛肉制品的重任,但面对基数庞大的牛群,却没有建立起高效的生产管理机制。牛的身份识别是建立相应管理机制的基础。现阶段主要通过给牛耳佩戴无线射频标签来实现牧场牲畜牛的识别和管理,但这种侵入式的方法容易造成牛的不适,引发咬标、掉标等状况,且传统方法耗时耗力、效率低下。随着人工智能的兴起,无接触、智能化的牛脸识别方法已成为牛的身份认证的研究
旋翼无人机因体积小、结构简单以及可垂直起降等特点,在军事侦察、农业植保以及电力巡检等领域得到广泛应用。随着人工智能和微处理器硬件系统的发展,无人机智能化飞行已成当前热门话题,而无人机自主着陆作为实现智能化飞行的重要一环,也受到广泛关注。在众多导航系统中,视觉导航具有抗干扰能力强和维护成本低等优点,非常适合无人机精确着陆的需求。因此,本文对基于视觉的无人机自主着陆算法进行了深入研究。为使无人机可以从
空气源热泵作为可再生能源利用技术之一,在清洁供暖的背景下得到广泛应用。管翅式换热器是空气源热泵常用室外换热器。暴露在室外的换热器工作时会出现积灰、脏堵、磨损等现象,尤其在西北地区常年多风沙等颗粒物,上述现象更加明显。颗粒物长时间在换热器表面的沉积与冲蚀,会形成脏堵与磨损,影响机组换热效率与运行安全,也与高效应用空气源热泵技术,为碳减排做贡献的初衷相违背,所以研究空气源热泵用翅片管式换热器脏堵与磨损