人类启动子识别算法研究

来源 :辽宁师范大学 | 被引量 : 3次 | 上传用户:liangchq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因草图完成后,确定基因和它们的调控网络成为一个具有挑战性的任务。启动子是基因表达调控的重要元件,在基因识别中具有关键作用。人类启动子识别技术已成为目前的热点研究领域,具有十分重要的理论意义与应用价值。   在阅读大量文献的基础上,本文对人类启动子识别技术进行了研究,提出了两种新的人类启动子识别算法。   提出了基于KL散度和BP神经网络的人类启动子识别算法。该算法首先应用KL散度提取分辨力最强的六联体,将其出现频率作为组成成分特征;然后提取CpG岛特征,并将其与组成成分特征相结合作为区分启动子和非启动子区域的特征向量;最后应用BP神经网络技术设计启动子分类器。该分类器由启动子.外显子分类器,启动子.内含子分类器和启动子-3’-UTR分类器组成,每个分类器都是一个BP神经网络,综合三个分类器的结果来识别启动子序列。   提出了基于两级SVM分类器的人类启动子识别算法。该算法应用支持向量机技术设计一个两级SVM分类器。第一级SVM分类器根据CpG岛特征对DNA序列进行分类,判别为非启动子的序列则送入第二级SVM分类器作进一步识别。第二级SVM分类器由三个SVM子分类器组成,即启动子-外显子SVM子分类器,启动子-内含子SVM子分类器和启动子-3’-UTR SVM子分类器,各子分类器根据组成成分特征识别启动子,通过三个子分类器的结果来综合预测启动子序列。最后将两级SVM分类器识别出的所有启动子序列作为最终的实验结果。   实验结果表明,本文提出的上述算法是有效的,具有较高的敏感性和特异性。
其他文献
在信息时代的今天,如何有效地利用大量的原始数据来分析现状以预测未来,已经成为人类面临的一个重大挑战。数据挖掘是致力于数据的分析和理解、发现数据内部蕴含的大量知识技术
随着B2B等应用的普及,越来越多的数据以XML文档的形式出现,如何对XML文档中的数据进行联机分析引起了研究工作者的关注。传统的做法是先将XML中数据转换为关系的元组,再进行
随着石油行业信息化的高速发展,油气田基础数据正以指数般的速度积累,如何将生产数据在油气田开发手册中及时、全面的呈现出来成为油气田企业需要解决的一个问题。油气田开发
随着P2P的广泛应用,基于P2P的应用研究日新月异,搜索技术就是其中之一。研究发现,在P2P网络中,即使每个节点共享少量文件,整个网络所共享的文件数量也是非常庞大,要想充分的
近年来,机器视觉技术已越来越多地运用于农产品检测领域中。目前,苹果、芒果等果蔬已能成功地通过大小、颜色、尺寸比等特征值进行分选。然而,由于不规则扁平粒状物的表面为
近年来,随着移动互联网的飞速发展,移动智能终端已经深深影响着人们的生活、学习和工作。然而,在众多的移动智能终端中Android系统的智能终端设备占据了巨大的市场份额。由于
制造执行系统(Manufacturing Execution System,MES)是面向车间层的管理信息系统,它是上层的计划管理系统与底层的工业控制系统之间的纽带。然而,传统MES通用性差,柔性不足,开发难
网格计算是近年来在国际上兴起的一种新技术。网格作为“第三代Internet",是把整个互联网整合成一台巨大的超级计算机,其根本目的是实现非平凡的资源共享和协同工作,消除信息
目标检测是计算机视觉的一项基础研究,其主要目的是对图像或视频中的物体进行检测与识别,从而实现对场景内容的理解。随着深度学习的发展,这项技术在近几年取得了巨大的进步。然
可扩展标记语言XML以其易用性、跨平台、良好的数据存储格式、高度结构化以及优越的网络传输等特性在计算机信息技术领域迅速发展,并作为Web服务开发的基础和标准广泛应用。