生物大分子的数学描述及其应用

来源 :大连理工大学 | 被引量 : 12次 | 上传用户:mmghb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类和一些模式生物基因组计划的相继完成或全面实施,生物学研究的重点正从积累数据向分析解释这些数据过渡,生物信息学(也称计算分子生物学)便应运而生。它的研究内容十分丰富,例如,序列比较、计算机辅助基因识别、分子进化和比较基因组学、RNA和蛋白质结构预测、遗传密码及其起源、序列重叠群装配、基于结构的药物设计等等,都是生物信息学中重要的研究领域。其中大多数领域的研究工作都有一个共同的需求,就是常常需要给出生物学数据的数学上的描述,因此,生物大分子的数学描述便成为生物信息学中一个非常基础又十分重要的课题。 本文的主要工作包括以下几个方面: 第一章针对原有图形表示的缺陷,从不同的角度在不同的层次上给出了生物序列的三种图表示。首先,直接从DNA原始序列出发,通过赋予四种碱基四个3维空间中的向量给出了DNA序列一种3维图形表示,同时在DNA序列的特征序列的基础上提出了两种2维图形表示:“双水平线”图和“梯状”图,这两种2维表示都既考虑了序列本身的线性结构,又考虑了四种碱基的化学结构。最后,面向所有生物序列的图形表示,从整体上提出了有向图的概念。有向图表示不仅弥补了现有图形表示的许多不足,还为生物序列的数值刻画提供了新的途径。 第二章提出了一个基于矩阵范数的新的序列不变量—ALE指标,它与目前应用最为广泛的序列不变量—最大特征值等效但它的计算非常容易,这使得基于不变量的比较方法在完全基因组比较及其相关研究领域中的应用具有了可行性。同时,还就某种特殊情况下最大特征值所反映的信息是否全面进行了探讨,并提出了伪迹的概念。此外,在有向图的基础上提出了生物序列的上三角矩阵表示,并对现有序列不变量在上三角矩阵情况下的兼容性作了讨论。为了更好地反映序列中元素,尤其是它们之间的序关系所包含的信息,本章最后一节从一般数字序列出发构造出一种特殊的链(全序集),在此基础上提出了DNA序列的正规化相对熵,并简要讨论了DNA序列基于正规化相对熵的12维向量表示在酿酒酵母基因组的蛋白质编码基因识别中潜在的应用。 第三章利用代数学中的同态思想对DNA序列进行粗粒化描述,提出了DNA序列的逻辑表示,并将这一概念推广到蛋白质序列。同时,给出了(0,1)序列的广义LZ复杂度,并将其和正规化相对熵分别应用到DNA及蛋白质序列的相似性分析。此外,根据RNA二级结构的特点给出了RNA二级结构的影子序列,并结合序列复杂性,对9种病毒的RNA二级结构进行了比较。 最后一章利用DNA序列的正规化相对熵和Fisher线性判别法对酿酒酵母基因-i-组序列进行基因识别。笔者将识别的准确度提高到了96%,得到了一个酿酒酵母基因组中基因总数为5873的估计,与普遍接受的5800-6000相符。
其他文献
本文主要研究平面多项式微分系统退化奇点与无穷远点的可积条件以及中心焦点判定与极限环分支,全文由七章组成。 第一章对平面多项式微分系统极限环分支问题与中心问题的历
本文主要利用复分析的方法讨论了某些二阶方程与广义k-正则函数的边值问题.共有三章,在第一章中主要运用文[2]中的理论与方法讨论了平面上双解析函数的非正则型Riemann-Hilbert
本文主要研究了两类延时神经网络模型的动力学行为。首先,通过巧妙地利用一些已知的定理和构造适当的Lyapunov函数,讨论了延时递归神经网络(RNNs)模型平衡点的全局渐近稳定性以
电阻率反演是地球物理反问题中一个重要的不适定问题。本文采用混合正则化方法来解决不适定的电阻率反演问题。在这篇文章里用到的混合正则化方法结合了全变差正则化方法和经
随着房地产行业的发展和繁荣,极大的推动经济社会发展,作为资金密集型行业,房地产企业筹融资管理问题是制约其发展的重要因素.本文将分析当前我国房地产企业筹融资管理中存在
David Hilbert在1900年国际数学家大会的开幕式上提出了23个公开问题,其中第16个是关于代数曲线的分类和常微分方程定性理论的一个非常重要但又非常困难的问题.可以说在上个世
改革开放三十多年来,尽管我国的经济发展迅速,但其也长期存在着区域间非均衡的发展,由于我国地域广阔、经济发展不均衡、经济制度环境以及资源条件等存在差异状况,致使了我国区域
非负矩阵的组合理论是研究那些仅依赖于矩阵的零位模式,而与元素本身的数值无关的性质,它与图的某些性质有密切联系。在信息科学、通信网络、计算机科学、编码和密码学、物理、
随着科学技术的迅速发展,数字计算机和数字通信提出许多具有重要应用背景的数学问题,其中就包括由数字通信的可靠性要求所建立和不断发展的纠错码数学理论。通信的可靠性提出纠
现金清收是商业银行不良贷款处置的最基本方式,但清收效果受多方面因素的制约而难以得到有效显现。本文主要探讨我国商业银行现金清收的现状、现金清收面临的主要困难及提高