蛋白质序列空间曲线构造及相似性分析

被引量 : 0次 | 上传用户:hnaylz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着测序技术的迅猛发展,生物序列的数量在数据库中呈指数形式增长。对于海量的生物数据,如何进行信息提取、比较分析、关系挖掘,已成为当代分子生物学和生物信息学的一个重要任务。  直接从杂乱无章的生物序列本身提取信息、发现其隐藏的规律,已经相对比较困难。生物数据的可视化研究为人们处理海量的生物数据提供了一种新的途径。如何有效利用生物序列的图形表示形式对序列进行分类及生物进化关系的分析,是生物信息学的一个重要研究课题。本文我们围绕蛋白质序列的图形表示方法、相似性分析方法、进化树构建算法进行了研究,具体的研究工作如下:  (1)我们给出了一种新的蛋白质图形表示方法。首先基于氨基酸的3个理化性质对蛋白质序列构造三维离散空间点列;然后使用三次Bézier样条曲线插值蛋白质序列空间点列将其转化为空间连续参数曲线,可使蛋白质序列的3D空间表示具有更好可视性。  (2)基于空间曲线的微分几何属性(曲率),我们给出了一种新的蛋白质序列相似性比较方法。首先提取曲线的曲率特征,并利用这些曲率特征构造频率向量;然后我们计算向量之间的L1距离来对蛋白质序列进行相似性分析;最后我们以9个不同物种线粒体NADH脱氢酶(ND5)序列为例,进行了数值描述和相似性分析,并做了相关系数及显著性检验,实验结果验证了本文方法的有效性。  (3)基于蛋白质图形表示,我们给出了一种新的进化树构建算法。首先基于蛋白质图形表示得到频率向量矩阵;然后对k-means算法进行了改进,提出了一种自适应聚类算法,并对频率向量矩阵进行循环迭代来构造进化树;最后我们以15个不同物种的β球蛋白序列为例,构建了进化树并与Clustalx和DNAstar软件构建的进化树做了比较,实验结果证明了本文方法的合理性及可行性。
其他文献
本文通过对荣华二采区10
在解决实际问题中,Boltzmann-Gibbs熵得到了广泛的应用,然而,由于Boltzmann熵的局限性,各种各样的广义熵开始得到人们的密切关注。Tsallis熵正是基于Boltzmann理论而产生的,
图像分割的应用广泛丰富,但是由于处理目标的多样性以及图像本身质量原因使得图像处理成为一个难点,传统的图像分割方法很多,应用比较广泛,但是都有各自的优缺点。自Osher和Sethi
线性模型在各个领域的广泛应用充分说明了线性方法的实用性,然而现实世界是非线性的,应用线性模型无法描述数据的某些非线性特征,因此,有必要用非线性方法描述事物的运动规律
随着科学技术的飞速发展及3D技术的提高,人们在数据采集和图形建模领域取得了很大的进步。基于数字分析的应用领域有很多,如:分子生物学、人脸识别、模式识别等。图形匹配是计算
作品编号:H020  《盛世牡丹》 赵湘龄  作品编号:S016 《晚霞》 高萍
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
作品编号:S006 摄影 郭进宝
随着计算硬件飞速发展,计算机的运行速度和对传统公钥算法的破解能力逐渐变得强大,对已存在的各种电子支付协议构成较大的威胁。研究者们通过构造出更加复杂的盲签名协议,来增强