基于路径相似性的蛋白质复合物检测方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:king_caspe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质复合物的检测对于研究细胞组成和细胞功能具有重要的意义。高通量实验技术的出现产生的许多大规模的蛋白质相互作用网络数据,这为我们研究蛋白质相互作用网络的拓扑结构检测蛋白质复合物带来了一个契机。然而,由于当前实验方法的缺陷和生物体的复杂性,蛋白质相互作用网络中存在着大量的假阳性和假阴性,这为准确地检测蛋白质复合物带来了一些困难。近几年,出现了很多检测蛋白质复合物的方法,蛋白质复合物通常都被检测为蛋白质相互作用网络中一个稠密的子图。本文提出了一个基于两级路径相似性的蛋白质复合物检测算法TLP(Two LevelPaths)。两级路径相似性即为,两簇蛋白质之间存在直接相连路径的概率和仅通过一个公共邻居节点相连路径的概率。用两级路径概率作为蛋白质对之间的初始相似性,再利用层次聚类算法贪婪合并具有当前最大相似性的两组蛋白质且合并后的蛋白质子图密度满足给定的阈值,合并蛋白质簇之后重新计算其与周围相邻接的蛋白质簇的两级路径相似性。直到图中当前没有符合合并条件的蛋白质簇为止,当前的蛋白质簇即为检测的蛋白质复合物。我们以标准蛋白质复合物数据库为参照,使用现有的和本文提出的评价指标,将TLP算法和其他六种算法进行比较分析。在三种不同规模和性质的酵母蛋白质相互作用网络上进行实验,我们的TLP算法都有着最好的表现,我们算法识别出来的蛋白质复合物和标准库有着很高的匹配率,可以作为进一步生物研究的参考。
其他文献
利用八通道滴定微量量热仪测定了在AOT/异辛烷反胶束体系中不同Wo(水与表面活性剂的摩尔比)、不同酸度(pH)和不同温度(T)条件下纤维素酶降解纤维素的热功率-时间曲线。利用热动力学
利用不动点指数理论讨论奇异二阶Neumann边值问题两个正解的存在性,推广和改进了已有的一些结果.
随着威海市经济的迅速发展和人口的不断增加,城镇规模进一步扩大,城市的用水量与日俱增。“十三五”期间,城市年用水量为6.5亿m~3,新增中水能力为5万吨/日。与此同时,城市污
考虑独立随机变量的和Sn=X1+…+Xn(S0=0),其中Xn,n≥2具有相同的分布F(x),x∈[-∞,+∞]及负的均值,X1具有分布G(x).在次指数型分布的条件下,我们得到了Sn的最大值分布的尾渐近估计。
房地产既是人们最重要的消费品,又是一项重要的资产,它与人们的生活消费以及企业的生产投资密切相关,从消费和投资两方面影响着宏观经济的稳定性。房地产行业已经成为国民经
电解液和正负极材料构成了锂离子电池,电解液在离子传输中扮演着关键角色,因此电解液的种类也决定着锂离子电池的电化学性能、安全性能,尤其在低温情况下。二氧化钛(TiO2)具有