基于调控范围语义相似性的致病基因预测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sscy2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量实验技术手段的不断发展和完善,多种类型的分子生物学数据也在迅猛增加。比如基因序列数据、基因表达谱、功能注释、蛋白质相互作用关系、代谢路径以及基因调控通路等。基于复杂网络对高通量生物数据建模,运用计算方法从中挖掘致病基因已成为当前生物信息学研究热点之一。近年来,基于功能相关的基因导致相似疾病的生物学假设,涌现出了很多致病基因预测方法。这些方法通过识别网络中的稠密子图达到致病基因预测目的,倾向于研究拓扑关系连接紧密的致病基因。然而,生物学研究表明在人类已经发现的致病基因中有77.6%的为非必需致病基因,它们大多分布在基因网络的外围区域,并不是网络中的核心节点。因此,如何刻画拓扑关系连接稀疏的致病基因之间的关系,是致病基因预测有待解决的问题。另外,生物网络数据存在高噪声和假阳性等问题,而且人类生物过程是有方向性的,比如基因调控过程,这些因素在许多致病基因预测方法中是被忽视的。本文采用网络可控性的思想,提出了基于调控范围语义相似性的致病基因预测方法。由于基因调控网络可以有效刻画基因在疾病状态下的异常调控过程,因此基于该网络预测致病基因更加准确。运用调控范围度量基因在网络中的影响力,结合语义相似性计算候选基因导致疾病发生的概率,最终依据概率得分对候选基因排序。实验结果预测出LRP1是阿尔茨海默病潜在的致病基因,PRCK1与EGF是卵巢癌潜在的致病基因,并且发现拓扑关系弱的致病基因在调控范围上具有相似的生物功能,这表明调控范围语义相似性能很好地刻画非必需致病基因之间的关系。留一交叉验证结果显示本文提出的致病基因预测方法相比于PRINCE方法准确率提升了7.95%。
其他文献
本文对基于并行平台的CFD软件在全机数值模拟中的应用进行了研究。文章建立了工作站机群系统作为并行计算平台,使用商业CFD软件Fluent及Cart3D实现了全机三维绕流流场的数值模
图像的上色、编辑传播、分割和抠图是目前图像编辑中常用的处理方法,也是计算摄影学和数字图像处理中热点的研究问题,可统称为图像的边缘敏感编辑。在传统的图像编辑环境(如P
计算机与通信的结合,就出现了计算机网络,网络需要遵守遵守共同的网络协议,为了减少设计过程中的复杂性,网络协议都分层组织。在两种著名的网络协议模型中,OSI开放式系统互联
随着手持设备的快速发展,移动终端设备开始呈现智能化、多样化、高性能化、互动化的特点,除了传统的基本通信功能之外,出现了越来越多的新应用,例如,移动支付、移动证券、移动视频
随着因特网的普及和海量在线电子文本的广泛应用,文本数量呈爆炸性趋势增长。文本分类作为组织和管理海量文本信息的重要技术在很多领域都得到了非常广泛的应用,已经成为数据挖
“区域网络化制造”是先进制造技术和网络技术相结合的产物,将给我国制造业的发展带来新的机遇和挑战。ASP(Application Service Provider,应用服务提供商)是一种业务租赁模
如今,随着软件产业进入一个新的时代,软件业正面临着一些新的发展和挑战,传统的软件设计思想已经远远不能适应新的需求,在此背景下,构件技术应运而生,并逐渐引起了人们的重视。构件
自动指纹识别技术是生物特征识别领域中一个研究热点,针对各种技术难题,有很多国内外学者对指纹识别技术作了深入研究,并提出不少算法或改进算法,取得了丰硕的成果。然而,指纹识别
随着Internet/Intranet的日益普及和Web技术的不断进步,电子商务,这一计算机网络技术发展的产物,在日常生活中的地位与日俱增。作为社会经济的基本行为在网络时代的体现,电子
计算机网络的稳定性一直以来都是人们比较关心的问题。提高网络稳定性的一个主要办法就是及时诊断出网络工作时出现的故障,给予网络管理人员决策指导。将数据挖掘技术应用于