DNA序列分类模型

来源 :浙江大学 | 被引量 : 0次 | 上传用户：jtfcyy

【摘要】

：

依据生物学知识，按照氨基酸分子中侧链基的极性性质，把碱基三联体分成五大类，即四大类氨基酸和终止码。以五类密码子出现的频率构成的特征向量来表征DNA序列。这是从不同序列中

【作者】

：

王显金

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2011年期

【关键词】

：

DNA序列密码子聚类分析特征向量马氏距离判别法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

依据生物学知识，按照氨基酸分子中侧链基的极性性质，把碱基三联体分成五大类，即四大类氨基酸和终止码。以五类密码子出现的频率构成的特征向量来表征DNA序列。这是从不同序列中氨基酸含量不同提炼出能从碱基含量和碱基排列情况两方面代表序列特征的氨基酸类别信息的方法。　　然后用三种统计方法进行分类。用马氏距离判别法和FISHER判别法对给定序列进行分类，样本回代正确率均达100％，二者分类一致率为90%；应用聚类分析方法对DNA序列片段进行分类，样本回代正确率达95%。　　本模型考虑结合生物学知识，特征向量维度较低，便于计算，分类结果精度较高，优于仅基于碱基含量的判别分类模型。

其他文献

图包含指定长度的圈和泛弧问题的研究

图论的研究已有200多年的历史。图论起源于1736年Euler发表的一篇论文，他用图论的方法解决了哥尼斯堡(Konigsberg)七桥问题。自二十世纪六十年代以来，图论得到迅速发展，涌现了大

学位

有限图圈2-因子泛弧图论多部竞赛图

一类新型的SturM-Liouville问题——来自地球流体力学

Sturm-Liouville问题起源于十九世纪初，是傅立叶为了解决固体的热传导问题而建立的数学模型。它的理论应用十分广泛，已涉足于数学、物理和地球气象学等现代科学领域，逐步成为数

学位

Sturm-Liouville理论流体力学边值问题Green函数特征值特征函数

回购契约在供应链协调中的应用

在市场需求不确定的情况下,本文对以下两种类型的供应链分别进行了研究:由一个供应商和一个零售商组成的供应链、由一个供应商和两个零售商组成的供应链。　　一、对由一个供

学位

企业经营供应链管理协调机制回购契约Nash协商模型

纵向数据下部分线性模型的分位数回归

部分线性模型是一种重要的半参数统计模型，纵向数据是指对同一样本或同一组样本在不同时间或空间上进行重复观测而得到的数据。这一特点决定了纵向数据既能更好地分析出样本随

学位

部分线性模型纵向数据分位数回归渐近正态性经验似然

遗传算法的若干改进及其在支持向量机中的应用研究

遗传算法是一类模仿生物进化过程的优化方法。近年来不仅在理论上形成了一套较为完善的算法体系,并且它的应用范围也得到较大的发展。同时遗传算法在不断的被改进,有些改进方

学位

遗传算法支持向量机自适应参数优化

基于混沌游戏表示的蛋白质3D图形表示及其应用

随着人类蛋白质组计划(HPP)的启动和后基因组时代的来临，生物领域产生了海量的蛋白质序列数据。应用分子生物学手段处理和分析这些序列不仅耗费大量时间和物资，还存在不稳定性

学位

混沌游戏表示蛋白质序列三维图形功能预测

基于区间直觉模型集的动态多属性决策方法研究

由于客观事物的复杂性、不确定性以及人类思维的模糊性，针对不确定环境下的多属性决策方法的研究已引起人们的极大关注，并取得了丰硕的成果。1983年Atanassov将传统的模糊集理

学位

动态多属性决策区间直觉模糊集不确定性属性权重

DNA序列分类模型

其他学术论文