序列结构二联语法识别miRNA前体

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xiaoxiaochengcfq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
miRNA(microRNA,小RNA)是近几年在生物体内发现的一种对基因表达起重要调控作用的单链非编码小RNA,它对疾病的发生、生物的发育、细胞的增殖等诸多生物过程有着十分重要的影响。因此miRNA的识别成为认识miRNA调控机制、深入了解其作用机理的首要任务。miRNA的识别方法包括实验和计算两种方法,由于计算方法的效率很高且其代价低廉,它受到科学家越来越多的重视。我们在论文中对miRNA的计算识别算法作了深入的研究,对单环pre-miRNA和多环pre-miRNA的识别提出了新的算法。论文工作主要包括以下三方面:(1)提出了二联语法来描述pre-miRNA的局部结构-序列特征,从而为miRNA的识别提供了一种新的特征提取方法。二联语法对pre-miRNA的序列和二级结构作如下处理:①精确描述pre-miRNA二级结构的子结构(包括内部膨胀和内部对称环)。②用空碱基屏蔽序列上频繁变异的碱基。③由序列的碱基和二级结构符构成二联子,并计算每种二联子出现的频率。为了测试二联语法的性能,我们训练了一个基于二联语法提取特征的SVM分类器。在miRBase 12.0上,这个分类器在人类数据集上达到了81.98%的敏感性和87.16%的特异性;在除人类的其他物种上,这个分类器能正确识别其中86.71%的pre-miRNA。在相同数据集上的对比实验表明,比起传统的结构-序列特征提取算法,二联语法算法能更精确的表述pre-miRNA最鲁棒、最本质的特征。(2)二联语法用于单环pre-miRNAs的结构-序列特征提取,而对于多环的pre-miRNAs,现在还没有专门的预测方法。我们对多环pre-miRNAs的预测做了初步的研究,提出了一种基于切分方法的专门针对多环pre-miRNAs的预测算法。该算法的基本思想是:把多环的RNA切分成多个单环的片段,然后选取最能代表这个多环序列特征的单环片段(我们称为主环),并根据这个被选取的单环片段的特征来判定多环序列是否是pre-miRNA。测试结果表明这种算法能达到令人满意的准确率,是预测多环pre-miRNAs的有效算法。(3)在提供二联语法算法源代码的同时,我们还利用CGI编程技术把该算法实现了网络化,使用户可以直接通过网络的方式使用我们的算法,从而大大简化了用户的操作,方便了使用。(4)初步研究了多环pre-miRNA的预测,提出了一种基于切分的预测多环pre-miRNA的新算法。
其他文献
德育是学校教育的重要组成部分.中学德育的养成教育是实现德育目标的重要途径,因此,实施学校德育应以养成教育为主,使其促进德育的发展和德育目标的实现.
近红外光谱技术可实现组织中血氧代谢的实时无损伤在体测量,在生物医学领域得到了广泛应用,发展了一些面向不同应用的测量方法和实验装置。广泛采用的光源与探测器间距固定的装置,只能反映组织特定深度的血氧信息; 基于光纤设计的单光源单探头,虽然可测量不同深度的血氧代谢情况,但仍不能进行同时测量。设计并制作了一套基于单片机与相敏检测的多通道近红外光谱血氧监测系统。系统选用三波长LED(735nm, 805nm
数学的学习离不开对问题的思考,在小学阶段,学生数学能力的提高往往是从解题中得到的.也正是如此,教师要在教学中强化解题的重要性,从重点的题型中找出数学的学习规律,在练习
高中生正处在青春期,三观正在形成阶段,因此高中政治教师不仅要对于学生进行基本的政治常识教学,还应当对学生进行思想品德教育,引导其形成良好正确的三观,但是学生往往对政
文言文的学习是对传统文化的继承和发扬,故而,文言文的深入教学极为重要.教师要深刻认识到这一点,在进行文言文教学的过程中,要加强对学生学习方法的正确指导,同时,要将学生
学位
当飞行器处于高超声速飞行状态时周围空气受到强烈压缩,在飞行器前部形成激波,激波后气体速度大大降低,来流气体所携带的动能大量转化为热能,使得流场温度迅速升高,高温气体对飞行
以工具辅助体育教学活动,以器械优化运动锻炼过程是近年来高中体育教学的发展趋势之一.同时,体育器械在教学中的运用极大地丰富了课堂的趣味性和活动性,增强了课堂的互动交流
数学乃我国众多数学家结合古人的智慧,所创造出的汗水结晶.数学本就是一门复杂而又深奥的学科,同时又融合于多学科交叉,如:“语文、物理”等,因此,难免对人员有较高的思维条
脉冲管制冷机作为一种新型回热式制冷机,由于其低温端无运动部件,具有结构简单、机械振动小、成本低、可靠性高、寿命长等优点,特别是在抗电磁干扰、降低振动和长寿命方面优