模块挖掘聚类算法的研究及应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fgvhfdvh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
后基因组时代,作为复杂网络的生物网络,受到广泛的关注。为全面理解蛋白质之间是如何通过相互作用来完成生命活动,必须分析蛋白质相互作用(Protein-ProteinInteraction, PPI)网络的特性,并通过这些特性挖掘蛋白质复合物(又称模块)以及预测未知蛋白质的功能。2006年Gavin等人发现蛋白质复合物通常由核心(core)和外围(attachment)蛋白质组成。近几年,针对查找core-attchment结构的复合物,出现了许多新的算法。本文主要对该类算法进行了研究,首先对CoAch(COre-AttaCHment)方法进行了改进。根据PPI网络特性改进了外围蛋白质(attachment)的加入规则,同时对整个算法进行了优化。接着将随机游走思想应用到查找core-attachment结构的复合物中,主要利用随机游走查找核心蛋白质。通过在PPI网络中应用,发现我们改进后的算法与其他的模块挖掘算法相比较,在预测蛋白质复合物准确性方面具有很大优势。最后,对复杂网络划分算法中的谱聚类算法进行了研究。传统的谱聚类方法必须预先确定聚类个数,而且对于大规模数据时间复杂度过高。因此,我们改进了传统聚类算法,在算法中加入了数据预处理步骤,同时将模块性Q(Modularity)函数引入算法作为衡量网络划分质量的标准。实验表明改进后的算法对网络的划分准确性较高,并且能够在较低时间复杂度内处理规模较大的复杂网络数据。总之,文中所研究的三个算法,尽管仍有许多需要改进的地方,但是它们都不同程度提高了原有算法的性能,而且与已有同类算法相比较具有自己的应用优势。
其他文献
移动Ad Hoc网络是一种由无线移动节点组成的具有任意和临时性的网络拓扑的动态自组织网络系统,具有较高的灵活性、移动性、自组织性以及随时随地接入等特点,但是由于节点的移
CT影像是肺部疾病临床检查的重要手段,随着CT技术的进一步发展,肺部检查所获得的数据量越来越大,巨大的数据量将对医生的诊断工作带来了极大的挑战。为了减轻医生的工作量,更
随着地震数据解释技术的成熟,在地质勘探中对地震层面及断层的解释已经成为一种趋势。本文以地震记录为研究对象,应用神经网络、小波分析和智能蚂蚁等数学算法完成地震层面及
近二十年来,随着计算机软硬件技术、计算机图形学技术以及虚拟现实技术(Virtual Reality,VR)的不断发展,虚拟摄像技术也已经迈入了全新的发展时代。现代影视节目的制作已经离
随着市场竞争的不断加剧,企业对降低物流成本的更高追求导致了物流提供商有必要从更高的角度来看待物流服务,把提供物流服务从具体的运输管理协调和供应链管理上升到对整个物流
随着多媒体技术的迅速发展和计算机的不断普及,计算机的性能也在不断发生变化。计算机运行速度快、运算量大、计算能力强等特点不断增强。同时,高质量视频的快速传输和共享已
为了应对服务及服务组合应用执行过程中所面临的各种异常情况,保证其运行效果,需要在异常发生或者预测到异常发生时对组合服务进行调整以适应执行环境的动态变化。相同的组合
入侵检测(Intrusion Detection)被认为是防火墙之后的第二道安全闸门。它通过收集和分析网络行为、安全日志、审计数据以及其它网络上可以获得的信息和计算机系统中若干关键
自治化是未来网络体系结构的研究中的一个主要方向和趋势。网络自治化的思想得益于自治计算、自治通信领域研究的思想,在网络体系结构设计中自治化功能,以便实现自组织(self-
根据金矿顶板的安全现状,分析现有的金矿顶板安全监测技术,总结其优缺点。根据煤矿测力锚杆监控顶板应力的成熟技术,提出一种应用于金矿的测力锚杆监控顶板应力的方案。根据