结合基因组变异数据的序列比对算法的研究

被引量 : 0次 | 上传用户:caonimalegebicaonima
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列的比对对于生物信息学研究而言具有重要意义。随着新一代测序技术的发展,科研工作者可以在较短时间内获得海量的数据。为了处理这种海量信息,出现了许多处理新一代测序数据的比对工具,这些工具给科研工作者提供了很大的便利。然而以往的比对大多数都是在一个参考基因组与所测的read数据之间进行,这种比对方式在有些应用面前就显得力不从心。在研究疾病与某种基因的关联关系时,通常会需要对一个基因组的测序数据与多个基因组进行比对。本文正是基于这种考虑,提出了结合基因组变异数据库(HapMap)的序列比对算法。文章将查找测序序列在参考基因组内与变异数据库内的最佳匹配位置的问题分为以下三种情况考虑:最佳匹配位置出现在基因组上的无变异区、有变异区、跨越无变异区与有变异区。无变异区内查找采用了BWT方法,有变异区内查找采用了equal_range算法,跨越区内查找采用了联合比对方法。首先介绍了课题的研究背景与现状以及比对算法的发展历程与应用背景,之后对现今主流比对算法(BWT方法与哈希方法)进行了分析与比较,并指出了这两类算法的各自优缺点,为本课题的研究做了技术上的铺垫。之后简要分析了基因组的共性与差异性在基因组序列中的表现形式,在此基础上,提出了结合参考基因组与变异数据的序列比对算法,文中对算法的基本思路、技术路线以及实现过程进行了简要的阐述。最后,将本文的方法与Bowtie和Bwa两类主流方法进行了比较,结果表明本文的方法虽然在速度上稍慢,但是在比对精度方面更胜于以往的方法。
其他文献
调查了唐山市建筑外墙保温技术的应用情况,分析总结了目前外墙保温体系在材料、设计和施工方法、防火和节能效果方面的经验和存在的问题,并借鉴国内外节能复合墙体应用的先进经
随着人群认知水平的提高,咨询检测范围的扩大,以及部分地区实施住院患者HIV初筛实验检查的措施,促使医院及疾病预防控制中心对HIV/AIDS患者的报告数逐年增加,从而也加大了疾
墨子与孔子、老子、韩非关系论王克奇墨子思想上承孔子,下启老子和韩非思想。孔墨皆法先王,重经典,以仁义道德为价值取向。“兼爱”对“仁爱”的超越,形成了儒墨两家的区别:儒家重
西门子的运动控制模块在自动控制领域有着广泛应用,本文从一个具体事例出发,详细介绍了S7-300的步进控制模块FM353在料道分组中的具体应用,以及西门子S3-300PLC与第三方的通
近年来,由于具有优越的催化活性、生物相容性、易自组装等特质,金属纳米材料、非金属纳米材料、半导体纳米材料均广泛被引入发光体系中,将其成功用于生物分析中。这些研究在
<正> 美国遭遇恐怖袭击与中东地区密切相关,其反恐行动更是为本已动荡的巴以局势增添了新的变数。美国中东政策的不确定性是巴以冲突的重要外因,反恐利益则是其中东政策变化
强化应用型学前教育专业本科生实践能力的培养是高校学前教育专业人才培养改革的重点。针对目前学前教育专业本科生实践能力培养的薄弱环节,高校学前教育专业应着力推进以实
批评语言学的方法论主要建立在系统功能语言学上。它特别强调对语篇生成、传播和接受的生活语境和社会历史背景的考察,并把注意力主要放在发现和分析语篇中那些人们习以为常
邻苯二甲酸二(2-乙基己基)酯(di-2-ethylhexylphthalate,DEHP)及氯氰菊酯(cypermethrin,CYP)是我国广泛存在的两种环境内分泌干扰物(environmental endocrine disruptors,EED
在啤酒酿制生产的过程中,原料的选择很关键,决定着啤酒的质量和风味。近年来,由于我国啤酒生产企业规模的不断扩大,企业在追求产量的同时,忽略了工艺原料的选择,造成企业的产