复杂网络社团挖掘及其在蛋白质模块预测中的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:chichilela
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来复杂网络研究的蓬勃发展引起了其它领域科学家们的广泛关注,越来越多的科学家开始使用复杂网络方法来思考和分析问题。目前复杂网络理论已被逐步推广到社会科学、生命科学、信息科学、计算机科学、系统科学等研究领域。社团挖掘是复杂网络研究的一个重要课题,在过去十年已经得到了快速的发展。但是已有的方法大多数都存在一定的局限性,这使得当其它领域的研究者将它们应用于自己的研究领域中时,很难得到理想的结果。  本文研究了两个方面的问题:复杂网络中社团挖掘的一般性方法及其在蛋白质模块预测中的应用。本文首先提出了两种不同类型的社团挖掘方法:点社团方法(Network Topology Algorithm)NTA和边社团方法(Edge Label Propagation Algorithm)ELPA。然后应用这两种方法在蛋白质网络中分别预测了蛋白质功能模块和蛋白质复合物。最后在大量不同类型的复杂网络中,检验了上述两种方法的社团划分质量以及它们预测蛋白质模块的性能。实验中我们的方法都取得了较好的结果,特别是在蛋白质模块的预测中表现更加出色。下面介绍本文的主要工作和创新点,包括以下几个方面:  (1)提出了一种新颖的点社团发现方法:NTA。本文量化定义了两种社团结构:强社团和弱社团,并定义了社团的成员属性和重叠成员属性,然后在此基础上提出了NTA算法。NTA是一种启发式方法,它仅依据网络拓扑属性来检测社团结构,适用于绝大多数的网络拓扑构型,具有较强的通用性,特别是在生物网络中具有良好的适用性。NTA还具有稳定鲁棒等特点,它以无监督的方式从大规模网络中检测社团结构,克服了已有算法存在的大部分缺陷,是一种简单高效的社团发现方法。  (2)提出了一种高效的边社团发现方法:ELPA。ELPA是一种基于边标签动态传播的聚类方法。不同于(Label Propagation Algorithm)LPA方法的点标签更新规则:“从众规则”,本文提出了一种全新的边标签更新规则:“三角形法则”。相对于“点”而言,“边”兼有了点和边的属性,具有发现重叠社团的天然优势。ELPA利用了这种优势,具有简单、高效和快速等特点。它不但避免了已有的动态标签传播方法存在的缺陷,而且克服了已有边社团方法存在的问题。通过在大量不同类型的网络中的检验分析,结果发现在绝大多数网络拓扑构型中,ELPA均表现出了良好的性能,是一种通用性较强的边社团发现方法。  (3)提出了一种基于蛋白质网络的系统化整合分析方法。已有的关于蛋白质网络的研究都是在某种单一层次的蛋白质模块上进行分析,比如蛋白质拓扑模块,功能模块以及疾病模块等。单一层次的分析方法虽然可以深入的研究特定蛋白质模块的性质和功能,但是无法发现系统水平上的涌现现象。本文首次将不同层次的蛋白质网络和模块整合起来执行多层次、系统化的分析。通过整合分析,本文发现了许多仅依靠单一层次分析无法获取的,系统水平上有意义的蛋白质模块,充分体现了系统化分析的优势。这种系统水平上的发现对将来疾病的预防,诊断和治疗具有积极的意义。  (4)基于本文提出的两种社团发现方法,在大规模蛋白质网络中预测了蛋白质功能模块和复合物。通过与已有的蛋白质模块预测方法的比较分析,结果发现这两种方法预测的蛋白质模块的质量比其它方法都有较为明显的提高。此外,它们不但可以发现稠密的,较大规模的蛋白质模块,还可以发现其它方法不易发现的小规模的和稀疏的蛋白质模块。这说明它们都可以从蛋白质网络中有效的揭示蛋白质功能模块和复合物。
其他文献
本报告概括了作者在博士后工作期间,在上海交通大学航空航天学院所从事的关于“航空人为因素”方面的交叉学科研究工作,涉及到航空医学、生理学、心理学、工效学等学科领域。
近年来,随着科学技术的迅速发展,人们日常生活节奏明显加快,定期进行健康体检变得越来越重要,为了有效减轻家庭医疗负担,让人们在家中就能够享受到自身生理指标的高质量检测,
随着信息技术的不断发展,计算机网络故障管理日益重要。网络故障诊断是网络管理的核心部分。如何提高网络故障诊断能力,实现高效准确的故障诊断,对降低网络维护成本以及提高
随着我国纺织业的蓬勃发展,纱线制造工艺的水平不断提高,对于纱线质量的要求也越来越苛刻。张力控制是生产过程中最重要的环节之一,控制系统的高敏感度、高精度、抗干扰性等
近年来,视频序列中运动目标的检测与跟踪成了计算机视觉研究中倍受关注的热门课题,并被广泛应用于精确武器制导、智能监控等军事和日常生活中。然而由于这一课题的研究内容涉
微小型无人直升机在军事和民用两方面都具有广阔的应用前景,近年来成为国内外研究的热点之一,是进行控制、导航、路径规划以及目标识别与跟踪等方面研究的良好平台。本文首先
复杂工业过程的监测与优化一直是过程系统工程领域的核心研究内容,同时也是企业安全生产和节能减排的关键。过程的监测与优化对于提高生产绩效、减少经济损失、增强企业竞争
基于多目立体视觉的三维重建技术是研究如何通过物体的二维图像信息来恢复其对应的三维信息,基本步骤包括图像采集,特征点检测与匹配,摄像机定标,三维点云重建,表面重建。三维空间
人脸识别是一项极具有发展潜力的生物特征识别技术,如何从人脸图像中有效地提取使之区别于其它个体的特征,是人脸识别研究的关键所在。最近几年,人脸识别技术取得了前所未有
学位