基于LVMM算法的拟南芥poly(A)位点识别及与SNPs关联性研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:hbimac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物的基因表达需要经过转录和翻译两个过程。在转录过程中,成熟mRNA要经过pre-mRNA的内含子剪接、5端加帽和3末端的多聚腺苷化加工(简称poly(A)位点)才能形成。其中,多聚腺苷化能标记出基因的终止位置,决定着基因结构,影响mRNA的稳定性,且在生物基因组中大量存在的单核苷酸多态性(SingleNucleotidePolymorphism,SNP)是生物个体间表现出多态性的原因之一。研究表明,若基因中含有多个poly(A)位点时,位于基因内各区域(如3,UTR)的SNPs可能会通过改变poly(A)信号或位点上下游各碱基含量影响mRNA的3末端poly(A)位点选择,从而引起基因表达的差异。因此,对真核生物体mRNA序列中poly(A)位点的正确识别将有利于我们判断基因的终止位置及其结构,为生物相关行业提供更可靠的信息。  本文首先结合生物学上对植物mRNA中poly(A)位点周围碱基及信号模式的了解,提出了把长度可变马尔可夫模型(LvMM)应用于拟南芥mRNA的poly(A)位点识别模型。该识别模型无需依赖于过多的生物学先验知识,无需对序列数据进行特征提取等操作,尤其适用于基因序列中特征不明显或新物种的位点识别。位点识别实验结果显示,LVMM在拟南芥poly(A)位点识别上取得了较高的识别结果且表现出良好的时间效率。其次,本文结合1001genomes网站所公布的拟南芥不同生态型的SNPs数据,提出了基于位点识别模型的拟南芥poly(A)位点与SNPs关联性研究流程:运用LVMM对筛选出来的SNPs-PAS序列集进行识别,获得有差异的基因信息并采用PASS识别软件对存在差异的基因序列进行位点评分,从而进行poly(A)位点与SNPs关联性研究。本文的ploy(A)位点与SNPs关联性研究流程充分发挥了LVMM在新序列集的位点识别优势,同时利用PASS的位置分值特性验证二者的关联性,实验结果也表明了所提出的poly(A)位点与SNPs关联性研究流程的可行性和有效性。
其他文献
无人机在民用和军用上的不断扩大,使得无人机不断向着速度更快、气动特性更加复杂、性能更加优越的方向发展,由此形成的无人机在大空域的机动飞行是一个强耦合、强非线性时变系
脉诊客观化是中医学研究的重要课题之一。研究者们一直希望能对中医脉象进行数字化采集和分析,排除医生判断脉象时的主观性和随意性。基于此,本文在脉象信号的数字化采集、数字
二维凝胶电泳技术是生命科学的重要研究方法之一,其主要内容为提取凝胶中的差异蛋白质点,而二维凝胶电泳图像的蛋白质点匹配技术是差异蛋白质点提取的关键步骤,匹配精确度直接影
随着我国特高压电网建设的全面推进,在建设特高压过程中电磁环境问题变得越来越突出,严重制约了特高压技术的发展。输电线路电晕放电是引起电磁环境问题主要原因之一,针对这一现象,论文立足于研究电晕放电电流的特征及求解方法,建立电晕放电模型,以期为减小电晕放电辐射提供理论指导。论文阐述了国内外特高压输电技术的发展现状,讨论了输电线路电晕放电带来的电磁环境问题,并总结研究电晕电磁干扰的主要方法,包括试验法,即
DNA测序技术是现代生物学研究的重要手段,近年来,随着下一代测序技术的问世,测序通量急速增长,测序成本直线下跌,使得对动植物分子生物相关问题的分析研究变得切实可行。然而,如何
在多通道位置同步控制系统中,衡量控制性能优劣的依据在于输出响应的动态性能、鲁棒性和同步控制精度。采用优良的控制算法和控制策略不但能提升上述三项指标,还能弥补硬件设计
随着机器人技术的发展,对机器人能力的要求也越来越高。目前,有关多机器人的研究日益得到重视,由于多机器人通过个体之间的协作可以完成个体机器人无法完成的任务。在许多应
近些年来,伴随着计算机科学和信息技术的进步,指纹识别技术得到了广泛的关注,也取得了丰硕的成果,尤其是对高质量指纹的研究已比较成熟,已广泛应用于人们的日常生活中。但是,
随着科技的发展,对人工智能领域的研究引起了越来越多学者的关注,其中,多智能体系统的研究也成为该方向研究的热点。多智能体系统的可控性是多智能体系统的一个的重要指标,也是研
时变参数不确定系统是定常参数不确定系统的推广,有广泛的实际背景。但由于时变参数不确定系统与定常参数不确定系统之间有着本质的区别,其自适应控制理论至今并不完善,还有许多