应用IDQD方法预测原核生物的sRNA基因

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:ryterj45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非编码RNA基因普遍存在于各类生物,主要来源于编码区基因的反义转录,长度介于50~500个核苷酸碱基的非编码RNA序列片段称为ncRNA或者是small RNA(简称sRNA),它们不直接参与蛋白质的合成,但在蛋白质的合成过程中起诸如催化的促进或抑制、蛋白质合成的调节与引导等作用。由于sRNA基因长度的不确定性、功能不明确性,并且不直接参与蛋白质的表达,在实际研究工作中,直接采用实验或者遗传的方法不易对其基因序列进行鉴定识别;本文旨在依托多样性增量判别法(以下简称ID)和贝叶斯判别法结合下的IDQD算法对原核生物中诸如大肠杆菌、沙门氏菌、志贺氏菌等细菌微生物的sRNA基因进行预测识别。  本文是根据sRNA序列的特殊性,及其上下游序列存在的相关性,首先对上述三种生物中现在已知的非编码小RNA进行统计,共搜集大肠杆菌sRNA基因序列共322条,其中79条经实验证明、247条是来源于文献预测的结果,沙门氏菌sRNA基因序列共36条,志贺氏菌sRNA基因序列共38条。鉴于沙门氏菌和志贺氏菌数据源较少,本文依实验证明的大肠杆菌79条sRNA基因的头部和尾部为基准位置,分别向前和向后截取总长度为100个碱基长度作为训练正集(此处,头部为向前70碱基、向后30碱基,尾部为向前45碱基、向后55碱基,此时实际预测的结果较好),同时,沙门氏菌和志贺氏菌正集检验集的截取原则和大肠杆菌完全一致;以大肠杆菌非编码RNA区域中取出所搜集到的全部322条sRNA基因及其上游70个碱基和下游55个碱基的序列片段,截成长度为100个碱基的基因片段(最后一段若长度不足100个碱基则反向截取这一段),并用Blastclust软件去除了相似性超过30%后的序列作为训练负集进行精度预测。通过对序列进行各类特征的研究,比较分析后在诸多特征参数中最终选定了诸如固定位点单碱基、碱基5模体、10碱基长度内的单碱基含量、次紧邻碱基2模体等特征参数,采用多样性增量法和在此下的二次判别法(以下简称IDQD)分别进行了敏感性指标、特异性指标、预测精度和相关系数的计算,为了使预测更合理,大肠杆菌采用了交叉检验的方式,沙门氏菌和志贺氏菌则采用独立检验的方式;经过对计算结果比较分析选定较好的预测方法( IDQD)和较好的特征参量组合,分别对三种生物的基因非编码区进行检索,查找出可能的非编码 RNA,并与已知的sRNA基因序列进行比较验证,其中共搜索到大肠杆菌sRNA基因序列共774条,和sRNAMap中接近度比较高的有92条,其中W链60条,C链32条;共搜索到沙门氏菌sRNA基因序列共693条,和sRNAMap中接近度比较高的有11条,其中W链7条,C链4条;共搜索到志贺氏菌sRNA基因序列共821条,和sRNAMap中接近度比较高的有20条,其中W链13条,C链7条。预测效果较好,有实际意义。  本文意义,一是在于探索原核生物sRNA基因预测的可行性方法,便于今后原核生物sRNA基因预测的方便;二是在于探索不同生物间sRNA基因特征的相关性,便于在不同生物间探索sRNA基因的结构和功能;三是在于搜索新的sRNA基因,便于对今后实验探索新的sRNA基因和对基因功能的探索;四是在于验证了sRNA基因头尾部特殊性及其与上下游序列的相关性。
其他文献
全世界对提高公共卫生的要求日益增长。生化传感器顺应时代的潮流,在各个领域扮演着越来越重要的角色。生化传感器检测技术根据检测方法可划分成基于标记检测和无标记检测两种
摇臂是滚筒式采煤机工作、受力承载的关键工作部件,同时又是采煤机截割部重要的一环,截割部的传动系统就安装在采煤机的摇臂上,同时摇臂还支撑着采煤机的截割滚筒,可以调节滚筒的
对于存在安全隐患且急需抢险处治的的滑坡、路堤边坡、基坑等救灾工程,坡体稳定性差,传统支挡结构难以实现快速施作,而微型桩具有明显优越性.但不同形式的微型桩,其承载力及
在初中教育领域中,语文教学是较为重要的,其中,阅读教学是重点内容之一,影响着学生思维理解能力,能够增加学生的词汇量等,但是,目前部分初中语文教师在阅读教学中,还存在较多困境,主要
随着光纤通讯技术的快速发展和光网络的广泛应用,光通讯器件获得到了迅速发展。空气隙标准具是制作无源器件的常用干涉光学器件,对它性能指标的检测和分析也尤为重要。  本文
本研究对野外意外发现幌伞枫(Heteropanaxfragrans)对薇甘菊的遏制作用现象、作用物质、作用机理均进行了初步的探讨。统计4年生态群落改造防治薇甘菊的各树种被薇甘菊侵染程
既往的研究表明,昆虫神经细胞电压门控钠通道是拟除虫菊酯类杀虫剂最主要靶标,神经敏感性下降是拟除虫菊酯类杀虫剂抗性昆虫产生抗药性的主要原因之一。细胞内游离的钙离子在调
换流变压器在实际运行时绕组电流中含有大量高次谐波分量,会在绕组、铁心和金属结构件中产生谐波漏磁场和高次谐波损耗。由于损耗在绕组、铁心和金属结构件上的分布不均匀,局部区域过于集中的损耗会引起绕组、铁心和金属结构件的局部过热,使得换流变压器内部各区域温升差异明显,即出现换流变压器内部各区域温度分布不均匀的现象,而传统平均温升概念不能够准确且全面地反映出换流变压器的真实温度分布状况。因此准确地掌握热源(
在喀斯特地区,碳酸盐岩石的溶蚀和风化会在地表浅层形成孔隙、裂隙等独特的岩溶地貌。一些被土壤填充的孔(裂)隙会形成相对稳定的小生境,可以支撑植物的生长,为其提供水分和
本文通过对荣华二采区10
期刊