基于多样性函数的单体域划分和tag SNP选择算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:gebilangzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)是指在人类基因组水平上由单个核苷酸变异所引起的DNA序列的多态性。基因组上的SNP位点及其相应的单体型信息已经广泛地应用在疾病易感基因定位和药物基因组学研究中。连锁不平衡的模式在全基因组关联研究中识别常见人类疾病这方面占有非常重要的作用。这些模式在人类染色体中呈现出块状一样的结构,通常具有高度连锁不平衡的区域被称为单体域。一少部分SNP(被我们称之为tag SNP)能够表示每一个单体域中单体型的模式。现有的算法试图将tag SNP的数目最小化,在这个目标的基础上将单体型样本划分为多个单体域。本文的研究工作如下:首先提出了两种动态规划算法并且结合了几种不同的多样性评估函数,用于在限制tag SNP数目的情况下进行单体域的划分。算法在使用相应的循环关系将原始问题划分成性质相同的子问题,同时也给出了两个算法的时间复杂度的推导过程。实验结果表明,该算法对单体型样本进行单体域的划分,得出的单体域和tag SNP的数目较其他方法有所减少。在利用了常见单体型评估函数的非单调性性质之后,我们算法的效果有明显提高。此外,基因数据存在特有的生物特性,计算方法可以利用这些生物特性对缺失的数据进行拟合,使其转化为生物研究所需要的数据。目前,补缺问题主要利用已有单体型数据对样本进行数据补缺。使用分块的方法将块中的数据分成缺失和完整两部分,通过统计块内单体型出现频率,将完整的部分作为参考单体型,来对缺失位点进行补缺。文章详细描述了非参考单体型下的基因型和单体型补缺的思想,通过实验得出了5种不同的策略在单体型缺失数据上的补缺结果,并对实验结果进行了分析和比较,指出了改进的JH方法不过滤掉有缺失的单体型,实验效果有了一定程度的提高。
其他文献
伊犁河流域横跨哈萨克斯坦和中国,拥有独立的内陆河流水系和径流区,流域内的主要河流伊犁河连接中哈两国。流域内水资源分布不均,生态环境日益恶化,伊犁河作为巴尔喀什湖水源的主要供给河流,关于该河流的水资源分配协议,中哈两国尚未达成一致。地表蒸散发作为水循环的关键环节,近些年来已成为水资源管理的重要研究对象之一。准确估算该流域内的蒸散发量和天然植被生态耗水量有利于该跨境流域的生态系统可持续发展以及和水资源
城市基础设施在城市建设发展过程中起着不可缺少的重要作用,担任着推进城市化过程中的物质保证角色。PPP模式能够很好的处理城市基础设施建设资金匮乏的现状,另一方面还能通
伴随“云计算”的成熟和发展,存储和访问数据的方式已经发生了根本性的变化。凭借“云”和“云存储”,每个网民的数据都可以安全、快速地汇总到一个数据中心。与传统的分散数据相比,这种大量数据是依靠“云计算”创建的,此集合称为“大数据”。数据的产生遵循数据的利用,而数据系统的核心数据(即公民的个人数据)面临过度滥用和非法使用的网络安全威胁。具体的体现是人们越来越享受大数据时代的便利,并且越来越意识到数据能够
淀粉是高等植物种子的重要组成部分,是决定作物产量和品质的关键要素。淀粉主要是由腺苷二磷酸葡萄糖焦磷酸化酶(Adenosine diphosphate glucose,AGPase)、淀粉合成酶(starch
基因功能注释是基因组注释的一个重要研究方向。而在后基因组的时代背景下,基因组注释又是最主要的挑战。它的研究将为人们深入理解人类基因组遗传语言的逻辑构架,基因结构与
目的:纤溶酶原激活物抑制剂-1(Plasminogen activator inhibitor 1,PAI-1)是丝氨酸蛋白酶抑制剂家族中重要的一员。内源性PAI-1主要的生理作用是快速抑制组织型纤溶酶原激活物(t
旅游文学是旅游文化的重要载体,旅游地的形象通过文本的传递直观展现出来,推动人们在旅游过程中的审美意识不断提升,它优化着旅游业的文化环境,也为文学多重价值的实现提供依据。文学旅游使游客实现现实与文本的互通,不仅可以满足游客的精神愉悦,还可以扩充当地的旅游资源,为旅游业提供文学层面的思考,推动当地旅游业发展。文学与旅游的融合是对景区进行开发和保护的重要方式,是保持文学和旅游共同发展的新引擎和新动能。文
社会发展促使人类不断反思自身进步与自然环境的关系,MFCs(Microbial Fuel Cells,微生物燃料电池)技术的探索充分体现了可持续发展思想。MFCs是一种以产电微生物的呼吸代谢为
不良贷款率攀升一直是困扰我国银行业发展的重要难题,尤其是在我国宏观经济增速日益放缓的背景下,城市商业银行作为商业银行中实力较弱,资产规模较小的企业正在面临着巨大挑战。由于城市商业银行主要以支持中小企业为经营使命,以促进地方经济发展为经营目标,他们为中国经济崛起起到了强有力的支撑和补充作用,因此从城市商业银行角度研究不良贷款对于保持今后我国经济平稳健康发展具有重大意义。从2017年开始,我国城市商业
水稻籽粒发育是一个复杂的细胞生理过程,始源于双受精作用,包含许多物质和能量代谢,其发育的过程可分为细胞组织分化、干物质积累和籽粒成熟干燥三个连续的发育时间段,涉及到