论文部分内容阅读
RNA是核糖核酸(Ribonucleic Acid)的缩写。它在核酶催化、蛋白质生物合成催化、遗传基因表达与调控等都起到关键作用,是重要的生物大分子之一。RNA功能多样性很大程度受其结构影响,要进一步探索RNA功能,首先需要了解其结构。主要的RNA结构有一级结构、二级结构与三级结构。RNA二级结构是研究三级结构的基础。但鉴于费用高、难度大以及RNA自身的特点,借助实验测定二级结构受到限制。因此,RNA二级结构的预测研究成为生物信息学的研究热点之一。
常用的预测RNA二级结构方法有:比较序列分析法、动态规划算法以及组合优化算法等。RNA二级结构预测可转化为组合优化问题。作为组合优化方法之一的神经网络方法,以其联想存储、自学习以及高速寻求最优解的能力成为一种有效的预测方法。
本文主要探讨使用Hopfield神经网络预测RNA二级结构,主要工作与创新点有:首先,阐述RNA的分子组成、分类及其功能,重点从热力学角度分析RNA二级结构的各个组成单元。其次,研究并实现三种预测RNA二级结构的Hopfield神经网络,通过实验比较这三种神经网络的预测精度,发现三种Hopfield神经网络的缺点以及预测精度低的因为,提出改进途径。最后,结合序列比对与神经网络的方法提出一种改进的神经网络:引入距离函数给网络的不同神经元赋以不同的初始值,采用所有可能的茎区集合构建网络神经元。运行神经网络时,根据初始化工作结果对不同神经元使用不同动力方程,并引入模拟退火机制使网络跳出局部最优解,当网络收敛时得到预测结果。通过实验数据证明改进后的方法能有效提高预测精度。