基于网络分析的蛋白质功能预测方法研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:yy13720
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是执行生物体内各种重要生物活动的大分子,认识其功能对推动生命科学、农业、医疗等领域的发展意义重大。传统的生物实验测定蛋白质的功能需要消耗大量的人力、物力、财力,并且效率低下,已无法满足数量日益增长的蛋白质序列的功能注释。故需要通过计算的方法预测蛋白质的功能,为生物实验提供理论指导,从而降低实验成本。随着高通量生物实验技术的发展,产生了海量的蛋白质相互作用(Protein-Protein Interaction,PPI)数据,基于蛋白质相互作用网络(简称PPI网络)的功能预测方法受到了越来越多研究者的关注,已成为后基因组时代生物信息学的一个研究热点。本文针对基于PPI网络的蛋白质功能预测方法展开研究,主要内容如下:(1)提出一种基于机器学习(层次聚类、主成分分析和多层感知器)的蛋白质功能预测方法HPMM。该方法综合考虑蛋白质宏观和微观层面的信息,将蛋白质家族、结构域和重要位点信息作为顶点属性整合到PPI网络中以减轻网络中数据噪声的影响。首先,基于层次聚类和主成分分析进行特征提取,得到功能模块和属性主成分特征,然后训练多层感知器模型,建立多特征与多功能之间的映射关系以用于功能预测。在三个分别被分子功能、生物过程和细胞组件注释的人类PPI网络上进行测试,对HPMM、余弦迭代算法(CIA)和有向PPI网络基因本体术语传播(GoDIN)算法的功能预测效果进行比较分析。实验结果表明,相较于CIA和GoDIN这两种完全基于PPI网络的方法,HPMM的微正确率、微查准率与微F1更高。(2)提出了双加权投票蛋白质功能预测算法BiWV。该算法通过构建蛋白质影响权重矩阵和功能影响权重矩阵,分别从蛋白质和功能术语角度进行加权投票来进行预测。在此基础上整合生物通路信息,提出带生物通路的双加权投票算法BiWV-P。在人类和酿酒酵母数据集进行测试和评价。实验结果显示,BiWV和BiWV-P能够有效预测蛋白质的功能,并且在多个数据集上微正确率与微F1均高于直推式多标签分类器(TMC),非平衡双随机游走(UBiRW),混合图上随机游走蛋白质功能预测(ProHG)这三种同类方法。综上所述,本文基于网络分析对蛋白质功能预测方法进行研究,提出了基于机器学习的蛋白质功能预测方法HPMM、基于双加权投票的蛋白质功能预测算法BiWV及带生物通路的双加权投票算法BiWV-P。在多个指标和数据集上的实验结果表明,本文提出的方法能够有效预测蛋白质的功能,为生物实验提供理论指导。
其他文献
本文研究了用于近场调控的全息阻抗表面,以解决超表面系统剖面大的缺点,侧重点在如何利用全息阻抗表面进行近场调控,实现聚焦、涡旋波束等功能。本文主要对两个方面进行研究,
本文旨在研究几类具有不连续系数的二阶微分方程的奇异摄动边值问题,这些问题产生于非匀质土的渗透等物理模型。首先研究如下的二阶半线性奇摄动边值问题:λε=h(x,y).y(0)=y
随着计算机的日益普及以及互联网技术的不断更新,电子档案的应用优势逐渐突出,越来越多的企业选择使用计算机实现对档案信息的录入和储存,这样不仅可以避免数据丢失,而且还能
由于人类长期的不合理开发利用资源,全球气候呈现出明显变暖趋势,极端事件发生频率不断增加,气候变化对自然生态和社会经济系统产生了巨大的影响和威胁。中国作为负责任的发
目前,温室气体,尤其是二氧化碳排放量的增加对环境、气候和生态造成了十分恶劣的影响。因此二氧化碳的回收再利用亟待开发。在解决此问题的过程中,研究人员发现,电化学还原二
南宁市万秀村少数民族流动人口融入城市生活过程中,形成了物质与制度层面的现实诉求,前者主要体现在居住场所、道路交通、环境卫生与休闲场所四个方面,后者主要体现在子女教
随着物联网应用的快速普及,医疗、运输、智能环境以及网络社交等领域都是物联网的主要应用范围。世界范围内的物联网将在不远的将来成为现实。但是,随着物联网应用场景的逐渐
欧盟作为国际政治中的非国家行为体,在国际社会上的地位日益重要。地理位置上的紧邻中东使得欧盟对中东地区有着多种不同的需求。经济贸易层面,中东国家是欧盟重要的贸易出口
在本文中,作者考虑了Heisenberg群H~n上的Radon变换,对偶Radon变换和Poisson积分,并得到了关于Radon变换的各种逆公式.此外,我们证明了Radon变换是一个从Sobelov空间W到L~2(H
量子纠缠的几何度量作为量子信息学中的一个热点问题在理论物理学、量子计算、凝聚态物理以及纠缠信道容量等多个领域内得到了广泛的应用,与之关系紧密的复对称张量的复最佳