组合多重证据促进真核生物基因结构预测

来源 :四川大学 | 被引量 : 2次 | 上传用户：baidu390

【摘要】

：

人类基因组计划的实施预示着现代生物学的发展进入到了组学的时代。当前，有近2，000个物种的基因组序列测定已经完成或者正在进行。基因组序列是一个物种进行一切生命活动的遗传

【作者】

：

李校

【出处】

：

四川大学

【发表日期】

：

2007年01期

【关键词】

：

基因预测计算机的基因发现基因组注释组合方法监督与非监督的机器学习 microRNA 比较基因组学生物信息学

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人类基因组计划的实施预示着现代生物学的发展进入到了组学的时代。当前，有近2，000个物种的基因组序列测定已经完成或者正在进行。基因组序列是一个物种进行一切生命活动的遗传与物质基础，解释和理解基因组序列的第一步是完整地注释其中参与编码蛋白质的基因。有许多证据能够对基因组注释提供支持，包括表达序列标签(Expressed Sequence Tag，EST)、同源蛋白质、基因预测软件的结果、相近物种间的保守片段等。这些不同类型的证据既能够相互补充，同时它们之间又存在冲突。人工的基因组注释主要是通过对比EST与基因组序列，产生一个可靠的注释结果。然而人工的注释耗时耗资，而且EST数据量的大小和质量严重影响到注释的完整性。计算机的基因预测能够提供了一个便宜的具有互补性的初始注释。计算机的基因预测主要是使用统计的机器学习方法，虽然在过去的20年里取得了重大的进展，但仍然有些问题亟待解决。当使用到大尺度的基因组序列时，当前的基因预测程序预测假阳性仍然偏高，而且对于缺乏训练数据的新测序物种会产生一个高度不准确的结果。本论文提供了一个基于分值的方法组合不同类型的证据，产生一个具有代表性的基因组注释结果。组合的证据包括与EST和蛋白质数据库的比对结果与4个计算机基因预测软件(Genscan，Augustus，Fgenesh，Geneid)的结果。首先，使用非参数估计统计方法转换不同证据的原始分值，使得转换后的分值能够准确地反映该证据的信任程度。我们测试了4种非参数估计方法——经验分布，分段线性函数，核密度估计，局部多项式估计，结果显示局部多项式估计是最可靠的转换方法。然后，所有的证据通过使用Dempster-Shafer证据理论结合投票的方法进行组合和归一化。最后，使用动态规划方法组合所有的证据到一个完整的真核生物基因结构。由于动态规划的方法组合基因结构不依赖于训练数据，因此此方法同样适合于预测新测序的物种。根据上述算法开发了一个真核生物基因结构预测软件，命名为SCGPred(Score-based Combinational Gene Predictorl。该软件使用Perl语言编写，为开放源代码。本论文详细地描述了上述组合算法的实现，并使用3个大的数据集评估了该软件的性能。其中，两个数据集(人的完整的第22号染色体和ENCODE序列集)用于评估该软件的监督的方法，而完整的玉米黑粉菌基因组则用于评估非监督的方法。结果显示，和其他的基因预测软件相比，我们的方法在敏感度和精确度上都有较大的提高，尤其是外显子水平。我们还证明，当应用到新测序的物种时，我们的方法同样超过了其他的非监督方法。除了编码蛋白的基因，当前研究发现有一类基因编码微RNA(microRNA)。这类微RNA通过碱基互补的方式结合到mRNA(通常是转录因子基因)上阻止该mRNA的翻译，或者启动该mRNA的降解。因此，是一种重要的后转录调控机制。使用比较拟南芥和水稻基因组并结合RNA二级结构分析，我们成功地预测了96条拟南芥微RNA，并显示这些微RNA通过结合转录因子mRNA参与到多重的代谢和遗传通路。

其他文献

鼻腔疾病患者鼻内镜术前的心理学评估

<正>近年,不断有鼻腔疾病患者鼻内镜手术后发生严重心理障碍或疾病的报道,因此而发生的医患纠纷,甚至暴力伤医事件也时有发生。能否在术前筛查出严重心理障碍的潜在患者,有效

期刊

鼻疾病(Nose Disease)心理学(Psychology)鼻内镜手术(nasal endoscopic surgery)评估(evaluation)

丝绸之路媒介呈现的社会语境及意义变迁

丝绸之路在中国媒介中的呈现是一个动态过程。不同时代丝绸之路的社会内涵与当时特定的社会语境紧密相关。本文对1949年以来以人民日报为主的国内媒体中与丝绸之路相关的报道

期刊

人民日报媒介呈现社会语境新中国外交

论中国传统陶瓷中的寓意文化

陶瓷是中华民族的伟大发明,是中国人民智慧的结晶,它不仅仅是一种供人们日常使用和观赏的器物,更体现了丰富的文化内涵。从器物造型,纹饰图案,名称谐音等方面探讨了中国传统

期刊

陶瓷器形纹饰谐音寓意文化

米力农与多巴胺治疗心力衰竭患者的效果比较

目的比较米力农与多巴胺治疗心力衰竭患者的疗效和安全性。方法选取2015年3月-2016年9月收治的心力衰竭患者135例,采用随机数字表法将其分为观察组68例和对照组67例。在基础

期刊

心力衰竭多巴胺米力农

用第三种文化解决中外文化冲突

通过对中西方在国际经济合作和市场理念上的研究,弄清中西方在国际商务上的文化差异,从而找出克服文化冲突的方法,建立起能够跨越合作管理的第三种文化,使中西方文化真正地融

期刊

文化差异商务冲突第三种文化

干净的渣土管道

伦敦是一个古老的城市,房屋的修缮任务很重但由于楼房栉次鳞比,空旷的场地较少,因此,在修缮时充分利用有限的空间,保护环境卫生就十分重要。我在伦敦访问时看到房屋修缮,都

期刊

渣土

自贡市环境空气污染动态监测

目的了解自贡市城市环境空气污染的动态情况,评价其空气质量,为预防控制空气污染提供参考依据。方法按国家城市空气污染监测的规范选择3个监测点,每点每日采用自动分析方法对

期刊

空气污染动态监测评价首要污染物超标污染物超标率

我国商业银行基层网点营销策略创新

基层网点营销策略的好坏直接关系到整个银行的经营状况,本文分析了我国商业银行基层网点营销存在的问题,并针对这些问题提出了一些策略。

期刊

基层网点营销渠道营销策略

浅析旅游高职院校的舞蹈美育中人文精神的体现

舞蹈美育是人才素质教育过程中的一项重要内容，通过舞蹈美育能够极大的提高学生的审美能力和文化艺术涵养。这是因为舞蹈美育是通过舞蹈艺术教学的方式来对学生进行审美教育，体

期刊

旅游高职院校舞蹈美育人文精神审美能力

微信公众号如何提升传播效果

微信公众号现已成为了人们线上阅读内容的重要来源。本文从微信公众号的运营现状入手,对微信公众号的数量、地位、市场等因素进行分析,提出微信公众号在内容生产方面存在的同

期刊

微信公众号内容生产传播效果同质化

组合多重证据促进真核生物基因结构预测

与本文相关的学术论文