【摘 要】
:
基因是遗传的基本单位,是携带遗传信息的DNA片断,而非基因部分不编码蛋白质,因此,从DNA序列中预测出基因区一直是生物信息学的重要研究内容。本文运用信号处理的理论和方法,
论文部分内容阅读
基因是遗传的基本单位,是携带遗传信息的DNA片断,而非基因部分不编码蛋白质,因此,从DNA序列中预测出基因区一直是生物信息学的重要研究内容。本文运用信号处理的理论和方法,包括变换域方法、数字滤波器、时频分析、统计学习和智能算法等来研究基因预测。首先分析了基因预测滤波器的原理,提出编码区序列的长度和周期性的强弱是影响预测结果的重要因素。根据基因编码区的周期性质,设计了具有窄带选通特性的FIR数字滤波器和自适应滤波器。利用已标注的基因数据进行计算,获得了时域外显子位置的预测曲线,说明所设计的滤波器是有效的,并且能够提高基因预测的准确性。其次将基因预测的滤波器与傅立叶变换相结合,提出了一种用于基因识别的改进傅立叶方法。该方法能放大周期3信号,滤除背景噪声,不受现有傅立叶方法对于序列长度的限制。实验表明改进的傅立叶方法提高了预测精度。同时,给出一种加窗傅立叶变换的方法,可以识别出DNA序列中的编码区和非编码区。然后将基因编码区的隐马尔科夫模型与前向算法相结合,实现了对外显子的识别。对已标注的DNA序列进行预测,该算法既有效,又降低了计算量。同时,将支持向量机用于基因分类,实验表明该方法不仅提高了预测精度,而且降低了训练所需的数据。最后分别研究了四种特征量和三种判别方法对算法预测精度的影响,在此基础上,实现了一种基于多种特征量的基因识别算法,实验结果表明文中给出的算法进一步弥补了傅立叶方法的不足,对于较短的基因序列,其预测精度高于现有的基因识别算法。
其他文献
随着香港、澳门相继回归祖国,区际司法协助问题也一跃成为我国国内面临的一个重要而棘手的问题。虽说台湾问题的解决依旧任重而道远,但“一国两制三法系四法域”的独特法律格
目的:探讨老年骨科患者的护理特点和护理方法,以提高护理质量。方法:总结分析我院235例老年骨科患者的护理经验。结果:235例老年骨科患者护理质量优良,无并发症发生。结论:根
针对乌什县林地资源现状,阐述了乌什县林地保护利用规划的总体目标、区域布局、并提出了保护利用方向,旨在达到全县林地总量控制的目的,为更好地管理乌什县的林地资源提供决
运用企业战略理论,结合汽车及其零部件产业国际发展动态和我国产业现状,对汽车零部件企业竞争力的概念、内涵进行了分析研究。对提高我国汽车零部件企业竞争力,更好地融入主
近年来,任务型英语课堂的研究已经成为语言课堂教学研究的焦点之一。它是“以目标为导向,以学习者为中心”的课堂活动。任务式教学法的中心思想就是促使学生以目标语进行沟通
本论文选定被广泛关注的5种邻苯二甲酸酯类环境激素,邻苯二甲酸二甲酯(DMP),邻苯二甲酸二乙酯(DEP),邻苯二甲酸二正丁酯(DBP),邻苯二甲酸二-(2-乙基已基)酯(DEHP),邻苯二甲酸
从频谱分析的角度描述了二项式系数滤波的功能,通过对几种常用的滤波方式谱曲线进行比较,阐明了只有二项式系数滤波不会产生相位移动,能有效地保留空间域复合变量基本变化的相位
环氧合酶-2(Cyclooxygenase-2)选择性抑制剂是一种非甾体抗炎药(NSAIDs),广泛地用在治疗风湿性关节炎、骨关节炎方面,并且取得比较好的疗效。目前已经上市的COX-2选择性抑制
随着数据挖掘技术的发展,数据挖掘的重要性已经被越来越多的人认可。它是利用已知的数据,通过建立数学模型的方法找出隐含的业务规则。在国外,很多的行业已经具有成功的应用;
自20世纪80年代开始,任务型教学受到国、内外学者的关注。在我国很多从事学校教育的工作者不断地开展了任务型教学模式在英语课堂上的应用研究。其中,大部分的研究是以城市中