论文部分内容阅读
核糖核酸RNA由生物基因转录产生。作为生物体内的一类大分子,参与了各项基本生命活动,如蛋白质的合成。因此,清楚认识RNA的分子功能,将有助于研究人员了解RNA与蛋白质间的相互关系,从而了解和治疗某些遗传疾病。RNA分子功能由其结构决定。RNA分子结构由三级结构组成:一级结构、二级结构、三级结构,由于二级结构介于一级结构和三级结构之间,存储较多高级结构信息,因此研究RNA二级结构成为生物信息学领域的重要研究问题之一。但是,鉴于RNA分子具有降解快、晶体难于获得等特点,用实验的方法测定其结构比较困难。因此,发展基于计算机算法的RNA二级结构预测方法是一个行之有效的途径。利用计算机算法预测RNA二级结构主要分为两类基本方法:自由能最小技术和序列对比技术。其中序列对比技术因需要更多先验知识,导致算法不易推广。自由能最小技术依据已有的热力学模型,通过不断向二级结构中添加如碱基配对、凸环、内环等各类基本结构,使得其自由能最小化,从而预测到最稳定的RNA二级结构,该方式简单易行,得到了大力推广,其中遗传算法因具有高度并行性,可有效降低某些不可逆操作带来的负面影响,被认为更适用于利用该类技术预测RNA二级结构。在利用遗传算法设计RNA二级结构预测算法时,需要解决两类重要问题即选择压力和种群多样性问题。选择压力有利于引导算法利用适应度标准更多的开发新个体,使得更多优秀的个体参与到迭代之中;而种群多样性是种群进化的基础。然而,若过分强调选择压力将在帮助算法快速收敛的同时,导致种群因丧失多样性而早熟;反之,若一味地为获取最优个体而维持种群多样性,将会因选择压力过小而导致算法收敛速度降低。因此,为平衡两者的关系,本文提出一个基于禁忌遗传算法的RNA二级结构预测方法(Tabu Genetic Algorithm based RNA secondary structure prediction, TGARNA),给出茎区相容性检测方法以改善种群性能,将禁忌思想融入遗传操作以防止近亲繁殖,保持种群多样性。本文主要内容包括以下几个方面:首先介绍了RNA二级结构预测的一些相关知识,如:RNA二级结构预测现状、基本原理、局限性等,并介绍了几类典型的基于遗传算法的RNA二级结构预测算法。接着实现了利用遗传算法的RNA二级结构预测方法,并对相关参数进行了讨论。最后实现了基于禁忌遗传的RNA二级结构预测算法,并通过实验对两类算法进行了分析比较,结果表明TGARNA算法能够有效预测RNA二级结构。