生物序列的图形表示及相似性分析

来源 :中国海洋大学 | 被引量 : 2次 | 上传用户:luoxuefubai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文内容主要涉及两方面:一方面是生物序列的图形表示,包括DNA序列的二维图形表示和四维图形表示以及RNA二级结构的二维图形表示;另一方面是在图形表示基础上进行的相似性分析,相似性分析用到的生物序列的数值特征有商矩阵的正规化最大特征值以及平均几何中心。 本文的主要工作包括以下几个方面: 在第二章,通过把DNA初始序列划分成一系列密码子,根据遗传密码建立映射,得到一种新型的非退化的二维图形表示。利用序列对应点的坐标构造商矩阵,以商矩阵的正规化最大特征值作为序列数值特征,进而对11种物种的β球蛋白基因的第一个外显子序列进行相似性分析。得到的相似性矩阵是合理的,并且有一定进步。 在第三章,改进了已有的四维图形表示。利用DNA分子中的四种碱基A、G、C和T的化学结构分类,给出了DNA序列的一种新的四维图形表示方法。在图形表示基础上构造平均几何中心作为序列的数值特征,并利用数值特征给出了两种度量DNA序列相似性的方法。 在第四章,用二进制码来表示RNA二级结构的特征序列中的碱基,把RNA初始序列转化成二进制编码序列,进一步构造映射并以‘worm’曲线为模板给出了RNA二级结构的二维图形表示。利用图形表示上对应点的坐标构造商矩阵,以商矩阵的正规化最大特征值作为二级结构的数值特征,并对9种病毒的二级结构进行相似性分析。
其他文献
随着医院信息系统(Hospital Information System, HIS)的普及与推广,医院业务数据逐步转换成为电子信息化。随着时间的推移,医院门急诊已经积累了大量的数据,其间蕴藏的丰富
本文数据来源于国家自然科学基金网和中国期刊全文数据库,样本选自1999-2007年数学学科的基金项目资助情况和论文发表情况。通过运用SPSS统计软件,本文在分析了1999-2007年数学
幂等元半环是一类非常重要的半环,许多专家学者对其进行了深入细致的系统研究.本文主要研究了几个晕要的幂等元半环簇,从多个角度给山了其中成员的不同刻划,并运用(2,2)型代数的
学位
本文研究了具有随机隐单元的渐增径向基函数(RBF)神经网络对紧集上的平方可积函数的逼近能力。在传统的神经网络逼近理论中,RBF网络逼近能力的证明主要是存在性的,并且在迭代过