大图理论在蛋白质相互作用网络比对中的应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:aujnqejbrob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,生物信息学发展迅速,它的研究主要集中于DNA和蛋白质。在这两者之中,蛋白质是各种生命活动的主要承担者,而蛋白质与蛋白质之间构成的相互作用更是使细胞结构得以维持和细胞功能得以实现的基础,因此,对蛋白质相互作用网络的研究具有重要的意义。通过比对与分析来自不同物种的蛋白质相互作用网络,我们可以推测未知蛋白质的功能、挖掘出保守的功能模块等等。到目前为止,已有许多对蛋白质相互作用网络进行比对的方法和工具,它们中大部分都集中于通过相似序列的局部或全局匹配来挖掘出不同物种间保守的蛋白质相互作用区域。但是如何加快网络比对的速度,改善网络比对的可扩展性和准确性仍然是网络比对研究中的热点和难点。本文考虑到蛋白质相互作用网络可图形化表示这一特点,以S.cerevisiae和D.melanogaster的蛋白质相互作用网络为基本数据集,分析并研究了一种基于大图分区理论的蛋白质相互作用网络比对方法。本文首先针对网络提出了一种分区算法,并运用一种全复制策略对各分区的边缘节点进行了处理;然后,本文提出了一种基于序列与网络结构的蛋白质相似性,并在网络分区的基础上实现了相似蛋白质的挖掘;接着,本文基于挖掘出的相似蛋白质进行相应保守模式的挖掘,并提出了一种基于序列相似性、相互作用保守性和功能一致性的最大保守模式挖掘方法;最后,本文进行了实验分析与验证,结果证明,将大图的分区理论应用于蛋白质相互作用网络的比对有着良好的效果,并能明显地加快网络之间的比对速度。
其他文献
一个3-(n,4,1)-填充设计是指一个有序对(X,B),其中X是一个n元集合,B是由X中的一些四元子集(称为区组)构成的集合,满足X中的任意三元子集最多出现在一个区组中.如果不存在3-(n
微等离子体放电特性,近年来受到国际上的广泛关注。由于放电空间尺寸很小,放电气体的压强接近大气压,微等离子体器件表现出不同于常规等离子体放电器件的特性。近年来作为一
为了实现将非洲资源环境统计信息和其他信息复合来进行综合分析,需要先将非洲资源环境统计信息进行地理空间分布化,进而将非洲资源环境统计信息进行空间可视化表达和分析。本
结瘤素基因(nodulin gene)是豆科植物与微生物共生固氮过程中宿主植物受诱导而特异性表达的基因,不但在固氮过程中发挥着重要作用,而且参与植物体的信号转导,物质运输以及渗
本文以Spot5高分辨率卫星遥感影像作为数据源,以福建省长汀县为试验区,开展了对长汀县2010年Spot5高分辨率遥感影像的多尺度分割和地物信息提取的研究。首先,针对Spot5卫星遥
城市信号平面交叉口是城市交通网络的重要组成部分,是不同方向的机动车、非机动车以及行人聚集的地方,因此也是交通安全事故高发的地方。不规则的信号平面交叉口因其特殊的平面几何特性,使得交通运行情况与普通规则交叉口有较大差别,因而存在更多需要关注的交通安全与运行效率的问题。基于交通冲突技术的研究方法相较于传统以统计事故数据为基础的方法,具有大样本、短周期以及易获取数据的优势。同时,交通仿真技术可以方便地对
我们提出了一个新的自回归时间序列AR(p)误差分位数的估计量,它是基于YuleWalker残差的核光滑化.在一些假设条件下,我们证明了这个新的估计量默示有效于用真实误差估计的分位
作为苔藓植物向种子植物的过渡类群,石松类和蕨类植物是最早分化出维管组织并产生孢子用以繁殖的维管植物。全世界约有11000多种石松类和蕨类植物,其中蕨类植物占90%。蕨类植
抗生素的主要来源是放线菌,其中主要是植物内生放线菌。由于植物内生放线菌的特殊生境,使得它们具有与土壤放线菌不同的代谢方式和功能,能产生一些抗菌、抗肿瘤、抗炎等生物
设Q是定义于[0,1]上平方可积的二阶实对称函数矩阵,LQ=-d2/dx2+Q(x)为二阶向量Sturm-Liouville算子,其定义域区间满足Dirichlet边条件.本文将Poschel J, Trubowitz E[24]关于