基于氨基酸约化和位置特异性得分矩阵的蛋白质亚细胞定位预测方法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:lipz7517
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了加速蛋白质结构和功能的注解进程,研究如何通过理论计算或统计方法来预测蛋白质在细胞中的定位就成了一个非常重要的研究课题。蛋白质亚细胞定位预测对蛋白质的功能、相互作用及调控机制的研究具有重要意义。其研究成果可对蛋白质相互作用研究及新药物的开发提供借鉴和参考,还可为蛋白质的信息分析和应用算法设计提供新的思路。目前蛋白质亚细胞定位预测的研究主要集中在以下几个方面:(1)构建或选择一个有效的基准数据集来训练和测试预测模型;(2)建立能够真正反映要预测序列的本质相关属性的数学表达;(3)开发强有力的算法;(4)寻找可以用于客观评估预测模型准确率的合理验证方法;(5)建立公用的预测网站。本文针对定位预测中信息的提取、挑选及融合等问题,运用机器学习方法对蛋白质亚细胞定位预测展开研究,主要工作如下:首先,我们提出了基于位置特异性得分矩阵(PSSM)的特征表示方法,在此基础上得到三种新的特征,分别表征了进化距离、区域组成和家族分类信息,构建融合模型来系统的提取序列信息,并使用主成分分析(PCA)算法挑选关键信息。同时,还详细讨论了不同参数对实验结果的影响,具体的实验及比较结果显示了该方法的有效性。其次,通过氨基酸物化性质和结构性质的约化,描述序列局部和全局信息的“组成”、“转换”和“分布”特征,并基于氨基酸亲疏水性的数值统计特征,提出了一种新的蛋白质特征表示方法(NSBH)。分别使用三种分类器KNN、SVM及BP神经网络进行预测,比较了几种方法和特征融合方法的预测结果,显示融合特征表示及结合SVM分类器时能够达到更好的预测准确率。最后,使用MATLAB实现相关算法的图形用户界面(GUI)设计。结合具体的实例说明GUI的设计、编译及打包软件过程,详细介绍了该软件的安装和使用教程,用户可以根据自己的需求选择对应的算法来验证或者应用。
其他文献
辣椒是一种重要的蔬菜作物和调料品,营养丰富经济价值高,深受人们的喜爱。但由于各种病害的危害,辣椒的产量和品质受到严重的影响。因此提高辣椒抗病性是十分重要的研究课题,通过
摘要:课外阅读属于初中语文课程中的关键部分,是同学们开阔眼界的重要方式,还是课堂授课的有效配合与有效延伸。文章主要讲述了引导学生进行语文课外延伸阅读的有效途径,从而提升学生的文化素养。  关键词:初中语文;课外延伸阅读;方法;分析  初中阶段,特别是七年级上学期,是小学和初中衔接的过程,还是学生们思想活跃的重要时期,如何引导他们进行课外延伸阅读,使课外阅读植根在学生的心中,这是一个重要的课题。在新
摘要:随着我国汽车保有量的激增和汽车维修技术的快速变革,以及汽修企业经营方法的革新,汽修专业所面临的机遇和挑战日益复杂,本文以汽修行业的发展现状和趋势入手,浅析了汽修专业中职学生职业规划需要考虑的问题和建议。  关键词:汽修专业;中职学生;职业规划  一、引言  人们的传统观念中,汽车维修这一行业又脏又累、满身油污、干的是力气活。包括我们自己和家长,多多少少也会有这种想法。但随着我国汽车保有量的不
苯胺是一种危害性极大的污染物,对人体有致癌作用.利用微生物降解这类化合物受到全世界各国的重视.本实验中前期研究中,从印染厂活性污泥中分离到的一株能高效降解苯胺的丛毛
研究表明,荒漠藻胞外聚合物(extracelluar polymeric substances,EPS)在其适应强辐射胁迫,温度胁迫和水分胁迫方面起着重要作用,同时在荒漠地区生物结皮形成中扮演着不可替代的生态学功能。然而,有关EPSs抗肿瘤方面的生物活性在国内外尚未见报道。本研究从EPSs对体外培养的人表皮癌细胞系(A431)存活率的影响,细胞的形态学变化,细胞DNA受损情况方面探索了EPSs的抗