基于密码子偏性和分枝聚类的密码子置换模型的统计推断

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:kinbay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是一门新兴交叉学科,研究内容涉及到生物学、数学和计算机等相关学科的知识。系统发生分析是生物信息学的重要研究内容之一,主要是利用概率统计方法和生物分子数据,对生物进化关系进行推断和评估。基于系统发生学的计算分子进化在进化遗传学、生态学、基因组学、病毒学和发育生物学等实验生物学领域都有很广泛地的应用,而以核苷酸、氨基酸或密码子为数据分类单元的概率置换模型的建立是计算分子进化的重要研究内容,因此,对概率置换模型的研究具有重要的意义。  本文主要对基于密码子偏性和分枝聚类的密码子置换模型的参数进行统计推断。本文第二章基于密码子偏性与氨基酸生化距离建立新的密码子置换模型,将新模型应用到两个真实的数据集,并与原模型进行比较来分析新模型对数据的适应性。分析结果表明新模型比未考虑密码子偏性和氨基酸生化距离的模型能更好地拟合数据,对参数的估计更加合理。第三章我们针对进化位点的差异性,首先利用聚类分析法判断物种间的相似度。在此基础上,然后根据相似度对物种进行分支分类,对不同的分支类别设置不同选择压力系数,并利用最大似然法对模型的参数进行了估计,通过具体数据集计算出物种各分枝的不同选择压力系数,最后将新模型与原模型进行了比较。第四章主要讨论了EM算法对存在插入、缺损的观测序列构建系统发生树的参数估计问题,重点在于应用EM算法在简单密码子置换模型JC69和K80下,对含不完整数据的序列伽马距离进行参数估计,并介绍了检验系统发生树可靠性的方法。
其他文献
本文运用混合有限元方法求解了二维超材料中时域麦克斯韦方程组的控制模型。本文所使用的混合有限元空间是第一类线性Nédélec元。尽管内边中点不是自然的超收敛点,但是经过
科学的人才观与发展观是推动经济社会持续发展的动力和基础。只有坚持科学的人才观、发展观,才能适应形势发展的要求,提高农村基层组织建设的成效,推动“三农”问题的解决,加
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
p枢纽中心问题研究在网络中如何选择合适的枢纽使O-D流(即从起点到终点的运输流)的最长到达时间最小。在实际的p枢纽中心问题中,时间参数往往带有模糊性,因此我们就需要采用
中职院校的学生在毕业之后需要面临具备标准普通话的就业要求,而目前很中职院校对于学生的普通话教育还有一些问题存在,比如培养的目标不够明确、学生的普通话水平过低、学生
在油田开发和勘探环节中,我们需要对油田地质特征进行研究。对油田地质特征进行详细地分析和研究,有助于油田的勘探开发,间接地促进油田开采的经济效益。本文对陕北油田的地质特
作为亚太地区展出规模最大、影响范围最广的标签、包装印刷专业盛会,2017亚洲国际标签印刷展览会(Labelexpo Asia 2017)将于今年12月5—8日在上海新国际博览中心举办。本届展
不等式的研究是分析学中一个重要的分支,各种平均值及其最优估计式广泛应用于物理学,力学,经济学,管理学等各个领域。本文研究一些经典平均之间的关系式。首先给出了双边最优不等