数据驱动的蛋白质互作用网络中复合体检测算法研究

来源 :山西大学 | 被引量 : 3次 | 上传用户:getold
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为生物信息学的研究热点之一,蛋白质相互作用网络中的复合体检测不仅对于关系数据分析、网络结构特征分析、生命活动探索等问题具有重要的科学研究意义,同时在蛋白质功能注释、疾病分析和药物设计等领域发挥着重要的应用价值.蛋白质相互作用网络中的复合体检测计算方法研究中,已有研究成果更多地从方法层面进行子图挖掘工作.随着复杂网络特征分析的发展和复合体特点的深入了解,蛋白质相互作用网络的小世界、无标度等复杂拓扑特征以及蛋白质复合体重叠性、小规模等特点,对蛋白质复合体检测算法提出了更多的挑战和要求,有待更加深入的研究.本文以数据为驱动来开展蛋白质相互作用网络中的复合体检测问题的研究.以数据为基础,针对蛋白质相互作用网络特征以及复合体特点,从不同的角度研究有效检测蛋白质复合体的算法,主要工作如下:(1)针对蛋白质复合体所具有的重叠性和小规模特点,提出了基于流模拟的复合体检测算法.该算法以网络流理论为基础,基于结点直接邻域信息给出了基于结构等价性的边容量和结点重要性度量方法,进而给出了流动源点的选择方法;从网络局部连边关系出发模拟了网络中的流动过程,使网络连通区域均能够获得来自不同源点的流量信息;参考信息传播中的线性阈值模型,设计了簇的判定条件.实验结果表明,该算法能够同时发现重叠簇和小规模簇,能够有效地进行蛋白质复合体检测,为流模拟思想在复合体检测算法设计中的实现提供了新的思路.(2)针对复合体的重叠特性,以及蛋白质相互作用网络中用于描述连边趋势的同配性特征,提出了基于网络同配性的复合体检测算法.该算法将结点重要性度量推广到结点的二阶邻域;通过引入网络同配性,实现了聚类过程中的多候选结点添加;为了评估重叠复合体预测结果的准确性,提出了一种簇之间重叠关系准确率评价指标.该算法建立了网络特征分析与网络模块发掘之间的联系.实验结果表明,基于网络同配性设计的复合体检测算法能够有效地进行重叠复合体检测.(3)针对复合体呈现出的中心稠密外围稀疏的结构特点,利用蛋白质相互作用网络中丰富的局部结构信息,提出了多信息融合的种子扩展复合体检测算法.该算法利用线性组合模型将多个网络结构信息进行加权融合,进而将结点重要性度量推广到结点的k-阶邻域子图;将概率模型用于种子选择,提高结构信息的有效利用,实现算法多样性;综合利用簇内密度与外围连边密度信息来刻画复合体中心稠密外围稀疏的结构特点.实验结果表明,新的种子扩展算法具有很好的复合体预测性能.(4)针对蛋白质相互作用网络所具有的小世界、无标度、聚集性等网络特征,提出了基于多网络特征的复合体检测算法.该算法通过相关性分析将网络特征引入到k-阶邻域子图内的结点重要性度量;结合无标度幂律分布和结点度信息,构建和分析了中心稠密外围稀疏的簇描述模型.多个网络特征信息的使用进一步增强了网络特征分析与网络模块发掘之间的联系.实验结果表明,所提出的算法能够很好地对蛋白质复合体进行检测.本文针对蛋白质相互作用网络特征以及复合体特点,结合复合体检测算法存在的缺陷与不足,提出了相应的复合体检测算法.研究工作既丰富了网络数据的分析方法,促进了计算机科学与生物学的结合与发展,又可以为关键蛋白质识别、功能注释、疾病分析等问题提供应用上的支持.
其他文献
若最优控制模型中含有时滞项,则称其为时滞最优控制问题。近年来,时滞最优控制模型已被广泛的应用到工业生产、神经网络、化学反应等方面。1,3-丙二醇(1,3-PD)是一种重要的化
创新型产品一般具有生产提前期长、销售季节短以及市场需求不确定性高的特性。在这类供应链中,常存在供需难以匹配的问题,导致供应链绩效表现不佳。已有研究表明,在应对需求不确定性方面,很多传统契约都能提高供应链的整体绩效,尤其是期权契约具有较好地控制需求风险和灵活调整的特性,其中看涨期权契约通过赋予买方向上调整初始订单的权利,提高供应链的柔性。很多学者将其应用到供应链中,作为一种解决措施被引入到非柔性供应
本文主要研究了带有执行器故障以及同时受到DoS攻击的网络化控制系统的稳定性问题.其中本文第三章研究了在DoS攻击下执行器故障的非线性网络化控制系统事件触发的无源性容错
机床热误差是由于机床受到热源影响结构受热膨胀导致的误差,在总误差中占据重要成分。热误差补偿研究中,建立热误差模型主要分为有限元法和数学建模法,机床由于受到内部热源
研究背景:偏头痛(migraine)是一种以复发性、单侧、中至重度搏动样头痛为特征的头痛疾患,典型的偏头痛发作一般持续4至72小时,发作前可出现视野缺损及视物变形、感觉运动障碍
视听跨通道整合在我们的生活中有着十分重要的作用,这种整合能够提高大脑对信息加工的速度和效率,促进我们对生活事件的整体性感知。但并非任何视听信息都会发生整合,视听刺激同时或相近时间呈现对跨通道整合十分重要。以往对视听跨通道同时性的研究都是在注视条件下,但是在日常生活中我们需要通过不断的扫视来获取感兴趣的信息。扫视会缩短神经系统对视觉刺激的反应潜伏期,将视觉刺激呈现时间的知觉提前,造成时间压缩和时序倒
长期以来,融资难、融资贵一直是制约我国农业和农村经济发展的重要因素,尤其贫困地区表现更为突出。为了解决农村地区金融供给不足、竞争不充分等问题,2006年中国银监会印发
“如何有效的瞄准受惠对象”是任何福利政策都需要面对的问题。精准扶贫政策实施以来,瞄准准确性有了很大的提升。然而,很多学者的研究表明,不管是客观标准,还是村民的主观认知,精准扶贫都存在较大的瞄准偏差。具体而言,这种偏差包括存伪型偏差和弃真型偏差。其中,存伪型偏差是指非贫困的家庭反而获得了相关福利,而弃真型偏差是指真正贫困的家庭没有获得受惠资格。这样的现状不禁让公众产生了一个巨大的疑问:究竟是什么导致
已有研究发现扫视引起视觉刺激时间加工的扭曲,其中一个重要的现象是“停表错觉”。停表错觉是指扫视时被试对视觉刺激呈现的持续时间高估的现象。另有研究表明,当判断视觉刺激呈现的持续时间时,会同时参考同步或异步呈现的听觉刺激的时间信息,将视觉刺激呈现的持续时间与听觉刺激的呈现的持续时间加以整合。但听觉刺激的呈现能否减小扫视诱发的视觉刺激呈现的持续时间高估现象还未可知。实验一使用时间比较法,在扫视时和注视时
在创新型产品的供应链系统中,影响供应链绩效的一个关键问题是供应与需求的不匹配。大量研究表明,在单一供应商与单一零售商组成的供应链中引入期权契约可以有效地解决供需不匹配的问题,提高供应链绩效。然而,引入期权实际上是将部分需求不确定的风险从零售商转移给供应商。即,供应商会有剩余产品库存的风险。而且,当零售商的个数增加时,供应商的风险也相应增大。为解决上述问题,本文针对由单一供应商和两个具有随机需求的独