生物序列数据比较与模体发现算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xsyangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是将计算机领域内的知识和技术应用于研究DNA(脱氧核糖核酸)、蛋白质等生物学问题的一个迅速发展的学科领域,而生物序列比较和模式发现是生物信息学的传统课题,在系统进化、基因调控、疾病治疗、病毒起源等重要领域的研究中处于核心地位。 近年来,随着生物测序技术的突飞猛进,生物序列数据以前所未有的速度增长。人工分析和处理生物序列数据无法再满足需求,计算机和网络技术的飞速发展,为分析和处理生物序列提供了新的强大手段。本文围绕生物序列信息比较与模体(motif)发现算法问题展开研究,完成以下工作: (1) DNA序列模体发现算法研究 DNA序列是最常见的生物序列数据,在DNA序列集合中发现模体的常见方法有统计学习方法和组合优化方法。本文围绕目前最常用的FM(Fixed number of Mutation)模体发现模型展开研究,首先给出一种基于样本序列比较来组合生成候选模体的方法,然后在此基础上设计出一种新的基于样本驱动的精确算法,与现有的模式驱动算法相比,在保持精度不变的情况下降低了搜索空间,同时克服了样本驱动算法适用面窄的问题。实验表明,该算法相对目前最优的MITRA(Mismatched Tree Algorithms)精确算法的性能有了较大的提高。 (2) 纳米计算平台的生物序列处理研究 对生物序列进行比较和在生物序列中发现模体往往涉及大计算量,因此并行化的设计是必不可少的,但是问题本身的串行处理特性使得并行处理较为困难。目前已提出的一种新的纳米计算平台上的系统结构模型——Cell Matrix能较好的解决序列处理问题,其同构的二维结构便于生产和扩展,用该结构来实现序列处理算法非常自然。本文实现了可以输出比对结果的双序列比对算法,它克服了Cell Matrix模型上已有的双序列比对算法只能输出比对得分的缺陷;首次在Cell Matrix模型上设计实现了生物序列模体发现算法。并用品格数量和晶格延迟两个参数分析了两个算法的时空开销。 (3) 基因组序列的翻转排序并行算法研究 基因组序列在遗传过程中最常见变异现象为部分子序列翻转。通过对翻转排序问题串行算法的研究,在PRAM模型和LARPBS模型上分别设计出时间复杂度为O(lg~2n)和O(lgn)的并行计算有向符号序列翻转距离算法(n为序列的长度);同时在LARPBS模型上设计出一个线性时间并行翻转排序算法。
其他文献
随着我国经济的快速发展,毕业生每年逐渐增多,加大了社会上的就业压力,这时对于人力资源档案信息化的建设就显得至关重要,它是现在事业单位管理的重要组成部分。本文就是针对我国
从课程的教学形式、实践操作训练、评价方式转变等方面,探讨了如何在计算机应用基础课程教学中进行新的改进,从而最终提高学生对今后岗位适应能力的综合素质,达到中职教育的真正
猪进行阉割的目的,在于提高生长速度,商品猪中,有时也发现数量不多的隐睾猪。消费者反映,这种猪肉一经烹饪,有类似公猪的性气味,而且肉的口味很差。近年来,我们在市生猪定点屠宰场从
以广州市和信阳市两所初中的387名学生为调查对象,采用层次回归方法考察了父母鼓励对子女阅读自主性的影响以及家庭亲密度和子女的阅读动机在其中的作用。结果显示:(1)父母鼓
对汽车无钥匙进入与启动系统现有技术进行了分析,从系统总成和系统功能两方面对基于单片机蓝牙模块汽车智能进入与启动系统进行介绍,提出可实行的研究方法和研究路线,使得汽
近年来,由于受到煤炭市场的冲击和企业对人才需求的下降,高职院校地矿类专业的招生和就业都遭受到了巨大的影响。文章以贵州职业技术学院为例,通过对当前地矿类专业的招生及
<正> 人类的身体是一个奇妙的结合体,它是由肌肉、骨骼和神经网络等组成的。如果人生病,器官就会受到损害,这时除了吃药、打针等治疗外,还有一些别出心裁的人造器官会帮助人
一枝红梅,独立寒冬,美在它的傲雪,美在它平添了风景的异彩;一只雄鹰,直冲云霄,美在它的勇猛,美在它划破了苍穹的寂静;一次大会.舞动三晋。美在它的时效,美在它填补了业界的空白。
在深入分析了地学数据特性的基础上,针对地学数据量大,访问海量地学数据时查询速度很难达到理想效果这一问题,指出对海量地学数据查询进行优化的必要性。本篇论文对表分区优
随着计算机技术和网络技术的发展,具有易复制、易修改和易传播特征的数字内容的各种应用蓬勃兴起,但这些特性同时是一把双刃剑,使得数字内容在其生命周期内随时面临被窃取、篡改