全基因组结构变异问题建模与算法

来源 :山东大学 | 被引量 : 0次 | 上传用户:q87995210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组重组,是基因组更改变换基因排列次序的行为,可形式化为翻转、移位、转位等基本操作。基因组重组,也是导致生命特征演化的典型结构变异行为。基因组重组排序,目的是找到最短的重组操作序列,将一个给定的基因组转化为另外一个基因组。这是推断生命演化过程,比较生命亲缘关系的组合优化问题模型。每个基因在基因组中仅限重复一次的基因组重组排序,已有广泛而深入的算法研究进展。Berman等给出的近似性能比为1.375的无向基因组的翻转排序算法,是当前最好的。Hannenhalli等对有向基因组序列构造断点图,并根据图中的特殊结构及其数量给出了翻转排序的多项式算法,Bader等人设计出计算翻转距离的时间复杂度为O(n)的算法,以及获取翻转之后新序列的时间复杂度为O(n2)的算法。对于有向基因组移位排序问题,Li等人给出了一个时间复杂度为O(n)的计算移位距离的算法;对于无向基因组移位排序,Cui等设计了时间复杂度为O(n2)、近似度为1.75的近似算法,目前Pu等给出的1.375近似算法,是解答该问题最好的算法。基因在基因组中通常会重复多次。然而目前针对允许基因重复多次的全基因组结构差异比较,还缺少有效的组合优化问题模型和算法。本文建立了一个组合优化问题模型,用于刻画两个基因重复基因组之间的重组距离。两个基因重复的基因组的翻转排序可描述为如下组合优化问题:给定一个源基因序列π和一个目标基因序列σ,两个基因序列的元素构成相同,目标是通过对基因序列进行一定次数的翻转操作,输出一个新的基因序列π’,消除基因序列π和σ之间的全部断点且满足操作的翻转次数最少。我们总将基因序列表示为一个字符序列,其中一个字符表示一个基因。本文给出两个解答基因重复基因组翻转排序问题的算法。(1)设计给出一个近似比为4、时间复杂度为O(n3)的翻转排序的近似算法。我们利用断点、邻接概念定义了基因序列中的块、同位置匹配块、和异位置匹配块。分类讨论执行不同的翻转操作对同位置匹配块和异位置匹配块的影响,对消除同位置匹配块和异位置匹配块以外的断点设计了特定的翻转操作。给出消除基因序列中所有断点的近似算法,并证明每两次翻转操作至少可以消除一个断点,从而证明算法近似性能比不超过4。(2)定义了表达两个基因重复基因组翻转距离的断点图。给出一个当断点图为无交叉图时,基因重复基因组翻转排序的精确算法。分析了无交叉图的三种简单结构,对无交叉图三种简单结构进行任意翻转操作并根据翻转子串的不同位置分类讨论,给出由无交叉图参数表达的翻转距离的上界。证明任意无交叉图可约减为简单结构的无交叉断点图。从而证明前面的翻转距离上界适用于任意无交叉断点图。我们设计的算法所得到的翻转距离恰好等于前面给出的上界,因此算法能够求到最优的基因重复基因组的翻转距离。本文的主要创新点:1.建立了含重复基因的基因组重组排序的问题模型,在此之前人们只对不含重复基因的基因组进行重组排序问题的相关研究。2.发现并定义了基因序列中的’块’,由此设计出一个近似性能比为4的翻转排序的近似算法。3.建立了表达两个含重复基因的基因组重组距离的断点图模型,给出无交叉断点图表达的基因组翻转排序的多项式精确算法,并证明其最优性。
其他文献
本文以灌溉诱发黄土滑坡为研究对象,在甘肃黑方台地区进行了滑坡的调查、测绘及取样工作,通过室内物理力学测试工作,得到了黑方台黄土的土水特征和非饱和强度特性;通过原位监
目的:比较人骨髓、脂肪及脐带三种不同来源间充质干细胞成脂分化能力的差异,并从microRNAs和基因表达的分子层面初步揭示其成脂能力差异的分子机制,为MSC脂肪分化异常相关疾
降水是在多种因素共同影响下产生的重要气候现象,是大气循环的重要组成部分,随着全球变暖,各种不合理人类活动的加深,降水突变现象时有发生,其规律性越来越让人难以捉摸。而
二氟亚甲基基团(-CF2-)由于其代谢稳定性和吸电子效应的特点,所以经常被引入到有机分子中,来改变分子的代谢稳定性和生物利用度。现如今,随着含二氟亚甲基化合物在医药、农药和
本文主要考虑一阶非线性时滞微分方程的h-p型时间步进法.一方面,我们针对非线性消逝时滞微分方程,提出了h-p型连续Petrov-Galerkin方法,得到了数值解在L2、H1和L∞范数下的误
植物抗寒性以及抗寒育种一直是植物学领域的研究热点,高山离子芥(Chorispora bungeana Fisch C.A Mey)生长在环境复杂多变的冰缘地带,是研究植物逆境适应机制的理想材料。本
为了合理的利用山地资源和能源,对山地地表参数(如地表温度、土壤水分等)的研究是非常必要的。地表温度(LST)是山地环境研究中的一个关键地表参数,因此对山地地表温度的研究
大分子蛋白的核质转运对于真核细胞的生命活动来说非常重要。核质转运涉及到核质转运受体蛋白(核转运蛋白)与底物以及与核孔复合体之间复杂的相互作用,需要RanGTP的浓度梯度
稀土掺杂的上转换发光纳米材料作为一种新型纳米材料,其具有许多优异的发光性能,如无背景干扰、大的反Stokes位移、高的抗光漂白性、较深的组织穿透能力以及低生物毒性等。因
近年来,依据大量理论方法,许多科研人员研究和探讨了分子中原子间化学键及范德华作用的问题。两个原子正是通过化学键等相互作用才形成分子,为了探讨原子间的相互作用特征,杨