论文部分内容阅读
随着高通量实验技术和计算预测技术的快速发展,目前出现了很多物种的大规模蛋白质相互作用数据。从大规模相互作用网络中识别蛋白质复合物,对解释特定的生物进程和预测蛋白质功能具有重要作用。一般认为,在蛋白质相互作用网络中,一个蛋白质复合物是一个稠密子图。然而,实际上真实的蛋白质复合物不一定总是稠密的。本文提出了一种新型的基于关键蛋白质和局部适应的蛋白质复合物识别算法EPOF。在EPOF 中,蛋白质相互作用网络中的所有关键蛋白质被认为是种子结点,其重要性与其在蛋白质相互作用网络中的度正相关。一个蛋白质复合物以种子结点为初始状态,并且根据其邻居节点的适应度值为判断条件进行扩充。当EPOF 应用于酵母蛋白质相互作用网络时,它能够识别大量的已知蛋白质复合物。我们将EPOF 与九个现有的算法EAGLE、 NFC、MCODE、 DPClus、 IPCA、CPM、MCL、CMC 和Core-Attachment 进行了性能比较。实验结果表明,EPOF 在与已知蛋白质复合物匹配、敏感度、特异性、综合评价、功能富集性和精度等各方面都有显著优越性。