原核生物基因识别

来源 :河北工业大学 | 被引量 : 6次 | 上传用户:l77500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是一门交叉学科。它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。 本文致力于分析DNA序列,找到能够区分蛋白质编码和非编码序列的特征,设计算法提高蛋白质编码基因的识别率。本文分析原核基因组中基因和ORF的结构特征,对描述基因特征的参量的提取做了一些尝试,并且对重叠基因进行了分析,设计了自训练识别原核生物基因的算法。 本文第一章主要介绍生物信息学的背景和相关的生物学基础知识,第二章重点介绍Fisher判别法,第三章和第四章是本文的主体,简要回顾了前人的成果并重点介绍了我硕士期间的一些工作。第三章蛋白质编码区识别,已知基因提取变量,设计算法识别基因,找到了两组参量,第一组是氨基酸不均匀度,第二组是碱基含量不均匀度和转移概率。第四章自训练方法识别原核生物基因,在已知序列的情况下,通过自训练算法预测基因。分析重叠基因结构特征是这部分的关键,找到了七种ORF筛选的方法: 1.去短留长ORF筛选; 2.信息熵相乘ORF筛选; 3.出现频率ORF筛选; 4.错位方差ORF筛选; 5.碱基平均自信息(熵)ORF筛选; 6.联合12自信息量ORF筛选; 7.氨基酸自信息量ORF筛选。 在检验时把两组参量的打分作为两个新的参量,提高了识别率。
其他文献
由于山区远距离输水需求不断提高,高墩大跨连续刚构渡槽形式随之出现,相应增大了渡槽间伸缩缝的长度,传统渡槽伸缩缝在受力、形变和耐久性等方面已无法满足其长度增加的要求
长大结构体系越来越受到工程界的青睐,这种结构形式多为重要的经济文化活动中心或交通枢纽工程,因此这种结构在地震过程中的安全性就显得格外的重要。目前这种结构的地震反应验
循环荷载作为一种荷载形式,对土的变形和强度特性及土体稳定具有广泛的影响。近年来,无论是土的动力特性的认识还是在工程上土的动力参数的应用都得以进步和发展。由于计算机
  目的:探讨低血流量阴茎异常勃起的病因、诊断及治疗.方法:选取2010 年9 月~2012 年10 月我院泌尿外科病房住院病人35 人,结合阴茎海绵体血气分析及彩色超声检查45 例均为低
会议
为了更加准确的预测饱和黏土地基的沉降发展,本文将分数阶模型引入到饱和黏土一维流变固结分析中,推导了分数阶流变固结方程,用Lαplαce变换及其数值逆变换求得数值解。在此
  目的:探讨西地那非联合督灸疗法治疗功能性勃起功能障碍的临床疗效及其安全性。方法:将我院男科门诊符合纳入标准的90 例男性能性勃起功能障碍患者,按随机数字表法(1:1)分为2