集成基因表达谱和PPI网络的蛋白质复合物识别方法

来源 :中南大学 | 被引量 : 0次 | 上传用户:tryst8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组测序的完成,拉开了蛋白质组学的序幕。蛋白质是生命活动的主要承担者,但不是独立的完成生物功能,而是通过蛋白质之间的相互作用绑定在一起形成蛋白质复合物来完成的。因此,用蛋白质相互作用网络(PPI网络)识别蛋白质复合物,对于揭示蛋白质的功能和特定的生物过程具有重要意义。本文的主要研究工作和贡献如下:通过集成PPI网络和基因表达谱,提出了一种基于时间片相关性的蛋白质复合物识别方法TACD。方法TACD首先根据基因表达阂值的研究,构建出每个时间片的PPI网络;然后运用已知的聚类算法到每个时间片的PPI网络,得到相应的簇;再利用时间片相关性对识别的簇进行融合;最后进行过滤处理。将方法TACD应用于酵母的PPI网络和基因表达谱,实验结果表明:方法TACD,对用动态PPI网络识别的蛋白质复合物,有良好的去冗能力。通过对蛋白质复合物的组成结构的分析,提出了一种基于核-附属结构的蛋白质复合物识别方法DPC,将每个蛋白质复合物分为两部分:持续表达蛋白质组成的核和瞬时表达的附属蛋白质,其中持续表达蛋白质是指在整个生命周期中都表达的蛋白质。将方法DPC应用于酵母的基因表达谱和PPI网络,实验结果表明:与方法COACH和Core-Attachment相比较,方法DPC能识别更多精确的核,并且在与已知蛋白质复合物的匹配方面上,明显优于方法CMC、MCL、SPICi和HC-PIN;方法DPC识别的复合物具有良好的功能富集性。图18
其他文献
操作系统安全是计算机安全的必要条件。开源Linux操作系统为我国发展以Linux为原型的自主产权的安全操作系统提供了良好的机遇。访问控制是安全操作系统中最重要的特性之一。
传统的计算机与人的交互中,人主要是通过键盘和鼠标对计算机发出指令的,而计算机则主要通过显示器向人传递信息。随着计算机的飞速发展,人们越来越不满足于仅仅通过键盘和鼠标这
空间曲面网格模型是虚拟现实系统中描述形体模型的最基本工具,也是科学计算、科学计算可视化、有限元分析的基础模型。在基于计算机图形学的网格处理算法的研究过程中,人们把更
随着计算机技术的飞速发展,计算机系统的性能越来越成为计算机系统成功的关键性因素,这一方向的研究成为了计算机领域的热点之一,计算机性能工程也发展成为了一个为解决计算机系
快照备份技术是提高系统可用性的一个行之有效的方法。在对影响磁盘阵列系统可用性的因素进行分析的基础上,深入研究了磁盘阵列实现的各种方法、磁盘阵列(Redundant Array of
机会发现(Chance Discovery)和机会管理(Chance Management)是国外学者于2000年前后提出的一个新的研究课题。因此对“机会”的特性,它作为一个独立的研究领域的必要性,它和传统的
计算机仿真技术是以计算机为工具,以相似原理、信息技术以及各种相关应用领域的基本理论与技术为基础,根据系统试验的目的,建立(实际或设想)系统的模型,并在不同条件下,对模型进行
随着信息技术的高速发展和互联网的迅速普及,导致在各个应用领域的数据库中存储了大量的数据,这些数据集中包含着很多有用的知识,因此如何从各种大型或密集数据库中发现所隐
近年来,随着嵌入式设备的蓬勃发展,各式各样的硬件设备、软件平台都被开发出来加入这场21世纪的移动通讯大战。在硬件设备上有Intel公司的StrongARM系列、Motorola公司的Dragon
随着计算机网络技术的飞速发展和广泛应用,网络入侵造成的安全问题正日益成为人们关注的焦点。传统的被动防御措施,如防火墙技术、数据加密等,已经不能完全阻挡入侵者的脚步,而具