论文部分内容阅读
目前,生物信息学已经步入了后基因组时代,对基因非编码区的研究已经成为后基因组时代生物信息学研究的热点问题之一,其中一个主要研究方向就是对转录因子结合位点的研究。转录因子结合位点是一种重要的转录调控元件,是基因组中具有调控功能的DNA序列片段。对转录调控元件进行识别与预测,将有助于探寻基因表达调控的规律,促进基因调控网络的研究。随着研究的深入和计算机技术的发展,计算识别的方法已逐渐成为传统实验预测方法的有力辅助工具。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响,为生物实验提供较准确的数据,促进实验研究。目前,已经开发出许多识别和预测转录因子结合位点的算法和软件,如MetInspector、MEME、AlignACE、Gibbs Sampler等。本文探求一种结合两种识别方法的转录因子结合位点预测方法,即将遗传算法和位置特异性得分矩阵结合在一起,并兼顾这两种方法的长处,提出了一种动态识别转录因子结合位点的方法——基于遗传算法和位置特异性得分矩阵的动态转录因子结合位点识别方法。遗传算法是模拟自然界生物进化过程的计算模型,作为一种全局优化搜索算法,遗传算法以其简单通用,鲁棒性强,应用范围广等特点,日益受到重视。而位置特异性得分矩阵方法具有参数少,计算过程简单,能够抵抗背景噪声和减少预测结果冗余等优点,已经越来越多地被应用于转录因子结合位点识别问题。本文将两者结合在一起,先通过基本遗传算法进行部分转录因子结合位点识别,然后构建位置特异性得分矩阵模型,并动态进行其余位点的预测。将本方法应用于酵母的转录因子结合位点识别实验,取得了较好的结果。另外文章将算法与基本遗传算法和MetInspector方法进行了比较,结果表明,本文的方法具有良好的性能和较好的预测效果,是可行且有效的。