【摘 要】
:
蛋白质与蛋白质间相互作用的准确预测是计算分子生物学领域的重要研究内容。虽然人们对蛋白质相互作用数据可靠性做了大量的研究工作,受限于当前的技术手段和预测方法,现在通过
论文部分内容阅读
蛋白质与蛋白质间相互作用的准确预测是计算分子生物学领域的重要研究内容。虽然人们对蛋白质相互作用数据可靠性做了大量的研究工作,受限于当前的技术手段和预测方法,现在通过各种途径所获得的大规模蛋白质相互作用数据的可靠性都不是特别理想。
不管是生物实验的方法还是计算机算法预测蛋白质相互作用,都面临着一个重要问题是预测结果中包括大量的假阳性数据,这些假阳性数据使得数据的可靠性大大降低。本文提出了利用蛋白质包含的GO短语间的语义相似性,定义蛋白质之间的相似性模型,进而提出了一种蛋白质相互作用假阳性过滤方法。实验结果表明,本文提出的过滤方法可以有效降低蛋白质相互作用预测数据集中的假阳性,提高预测的准确率。
为了获取具有高度可靠性的蛋白质相互作用数据,本文结合了蛋白质的结构域信息以及GO注释信息,利用最大似然估计模型预测蛋白质中存在的相互作用。与只用一种蛋白质信息来预测蛋白质相互作用相比,结合了两种蛋白质信息可以大幅度提高真阳性数据的比例,而假阳性数据只会轻微增多。同时,本文中的方法可以用来给蛋白质对赋值表明其发生相互作用的可能性。
其他文献
随着信息技术和互联网的发展与普及,越来越多的人能够在网络上随时随地的发表自己的想法,分享自己的所见所闻;在线社交网络(比如Twitter、Facebook、新浪微博等)在信息的传播
XML因其具有自描述性,可扩展性以及开放性等优点已经成为网络上信息表达和数据交换的事实标准。随着XML数据的不断增长,尤其是大规模XML数据的出现(如XML数据库),对XML数据的
随着Internet技术的快速发展,Web数据库越来越受到人们的重视,Web按其所蕴含信息的“深度”可以分为Surface Web和Deep Web两部分。与Surface Web相比,Deep Web蕴藏了更加丰
计算机系统的飞速发展给软件提出了更高的要求,如何提高软件质量这一课题的研究越来越得到人们的重视,而软件的可靠性、正确性、安全性等性质是保证软件具有高质量的关键因素
随着计算机和网络技术的快速发展,互联网在人们的日常生活中发挥着越来越重要的作用。信息检索作为互联网应用的重要组成部分,是用户获取信息的主要方法。目前,信息检索一般
随着信息技术的发展和IP网络的应用普及,能够接入网络并且接受远程监控的网络用具逐渐走进人们的生活。网络用具涵盖范围非常广泛,包括数字化、智能化了的各种电器或增加了控制
随着信息化建设步伐的加快,如何有效化解安全风险,有效应对各种突发性安全事件已成为不容忽视的问题。当前,国家级的通信平台、政府职能部门、电信通讯运营商、跨地域大型企
Internet的飞速发展极大方便了人们对信息的获取和使用,但同时也带来了信息过载的问题。在这些海量信息中快速、准确地找到所需要的信息变得越来越困难。面向查询的多文档自
数据挖掘是一门从大规模的数据中提取有用信息的技术,数据预处理是数据挖掘任务过程中一项重要的环节,特别是挖掘海量高维数据的信息时数据预处理就显得非常重要。因为通常用
布料湿润效果模拟是计算机图形学领域的一项重要研究课题,应用极其广泛,如商业领域,影视动画,虚拟现实等。随着计算机硬件技术的不断进步和物理学某些领域研究的不断深入,与