基于智能计算的蛋白质功能预测研究

来源 :东华大学 | 被引量 : 4次 | 上传用户:dingdingdeaiqing85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命体赖以生存的营养要素,是细胞组织的重要组成部分。几乎所有的生物过程都与蛋白质发生某种联系。根据蛋白质序列的排列顺序和序列信息确定蛋白质的功能成为生物学研究重点。目前蛋白质序列数量的激增,急需要开发快速、准确地计算工具预测蛋白质的功能。研究蛋白质序列信息与其功能的关系也是这个领域的研究重点。本论文围绕蛋白质功能预测的几个重要方面:蛋白质亚细胞位点预测,蛋白质结构类预测和单序列蛋白质二级结构预测和蛋白质序列内功能Motif发现展开研究,目的是开发一些根据序列信息预测蛋白质功能的方法。论文的主要研究成果如下:在蛋白质亚细胞位点预测研究中,根据Chou提出的伪氨基酸组成离散模型,提出一种改进的伪氨基酸组成模型。使用免疫遗传算法优化附加特征向量的权重。在改进的伪氨基酸组成模型框架中,使用数字信号处理技术和疏水氨基酸对模式表示序列的附加特征,应用扩大的协方差作为预测工具,预测了真核细胞12类亚细胞位点。然后提出了一种基于特征选择的集成分类器的预测方法,用于凋谢蛋白的亚细胞位点预测。使用具有不同间隔的氨基酸对组成表示序列特征,经过特征选择后形成更加有效的特征组合。集成分类器中的基本分类器为模糊K-近邻(FKNN)分类算法,Jackknife测试和独立数据集测试证明了该方法的有效性和实用性。在蛋白质结构类预测研究中,提出了三种结构类预测的方法。第一种是基于二叉树支持向量机的方法,发展了一种新的伪氨基酸组成表示序列的特征。结合了传统的氨基酸组成,序列内氨基酸相互关系和疏水模式,使用二叉树支持向量机作为预测工具,采用标准数据集验证了方法的性能;第二种方法是基于改进的伪氨基酸组成模型的结构类预测方法。将蛋白质序列映射为短的时间序列,计算序列的近似熵,构造了一种27-D的伪氨基酸组成表示序列特征。FKNN分类算法作为预测工具,免疫遗传算法优化附加特征权重系数。在“严格”数据集测试中取得了较好的结果;第三种方法是两层模糊支持向量机网络的方法,在第一层中,基本的分类器是模糊支持向量机,输入数据是基于不同物理化学属性的伪氨基酸组成。组合第一层中各个模糊支持向量机的输出数据,作为第二层模糊支持向量机分类器的输入数据,经过决策后得到最终结果。在蛋白质二级结构预测研究中,提出了基于最大熵概率模型的预测方法。考虑了蛋白质序列的结构类信息和目标残基的上下文环境,设计了影响残基二级结构的特征空间和特征模版。将这些特征都包含进入最大熵概率分布模型中,根据结构类不同分别训练和建立二级结构预测模型。算法中二级结构的特征信息仅来自于序列本身,没有考虑多序列排列信息。目的是解决“孤立”蛋白的二级结构预测问题。实验证明预测算法具有较高的准确率和实用性。由于细胞核内空间狭窄和蛋白质的不稳定性,核内亚空间的蛋白质位点预测成为难点。本论文提出了基于近似熵的伪氨基酸组成方法,采用集成AdaBoost分类器作为预测工具,用于蛋白质亚核位点的预测。在两个标准数据集上的测试表明了该方法的有效性。蛋白质家族内序列具有相似的功能,序列内的重点区域Motif也应该具有相似性。本论文提出了一种Motif发现算法,在蛋白质家族内寻找重要的Motif集合,验证序列所属的蛋白质家族。在连接酶的21个亚家族识别中,建立了一个实用的连接酶亚家族服务器。最后,对全论文的研究内容进行了总结,指出了研究工作中存在的不足,明确了下一步的研究方向。
其他文献
随着全球新能源经济的兴起,锂矿资源的开发和利用受到了市场的广泛关注。锂矿资源是一种具有重要战略意义的金属能源,对国民经济和国防安全有重要作用。基于此,本文就全球锂
随着我国住房改革制度的不断推进,房地产业呈现出蓬勃发展的态势,成为国民经济的支柱产业。房地产业的健康发展,可以提高居民住房水平,改善居住质量,满足人民群众日益增长的
改革开放几十年,虽然中国的经济实力得到了飞速增长,但是很多城市居民的住房问题依然未能妥善解决。以上海地区为例,一个人口超千万的特大型城市,住房资源已经十分紧张,不断
在生物数学研究中,种群动力学性质已经成为了一个重要内容,而关于具随机扩散项或者非局部扩散项的种群模型的动力学研究已经受到了许多数学家和生物学家的广泛关注和深入研究
第一部分Skp2在早孕小鼠子宫内膜蜕膜化中的作用目的:蜕膜细胞的增殖与凋亡的动态平衡是维持蜕膜化正常进行的关键。Skp2作为促进细胞从G1期向S期转换的重要调控因子,它可以使cyclin、CKI等靶蛋白泛素化,从而调节细胞周期,进而参与细胞增殖和凋亡的调控。研究发现,Skp2在多种癌症的发生过程中发挥重要作用,但其在早孕小鼠子宫内膜蜕膜化中的作用尚不清楚。本研究拟在观察Skp2在围着床期小鼠子宫内
非线性微分动力系统的分岔控制与混沌控制研究近年来引起了科技工作者的浓厚兴趣,混沌控制的研究成果较多,而分岔控制的研究成果相对来说要少些。分岔是非线性系统特有的现象
<正> 为了估计水库由于大坝失事对其下游造成的影响,若采用详细的计算方法,但失之过繁,且由于条件复杂,有时也难得出良好的结果。因此,在实际工作中,一般都采用简化法,即先求
<正>记者从中国慈展会组委会获悉,第四届中国慈展会增设"公益集市",为个人、企业和社会组织的爱心物品提供交易平台,倡导"消费即慈善"、"人人慈善"理念。为了让更多人参与义
期刊
2018年9月10日,全国教育大会召开,会议指出:“健全全员育人、全过程育人、全方位育人的体制机制,不断培养一代又一代社会主义建设者和接班人。”新时代的教育号角已经吹响,“
近年来,由于国际经济发展不稳定,经济发展速度变慢,银行理财业务出现了诸如业务监管制度存在漏洞以及业务办理存在违规操作等许多问题,大大不利于经济稳定发展。在这样的情况下,强化监管政策,加大对银行业务的监管就显得十分重要。2018年4月27日,国家监管部门颁布了《关于规范金融机构资产管理业务的指导意见》(以下简称:资管新规),这一意见对商业银行理财业务包括资管业务出具了更加详细的运作方法。新的政策的出