基于序列的蛋白质金属离子和自由基离子位点预测问题研究

来源 :东北师范大学 | 被引量 : 1次 | 上传用户:wwucg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人类基因组计划完成后,以研究蛋白质间相互作用与识别为核心的蛋白质组学(Proteomics)迅速兴起。其中蛋白质-配体对接方法是研究蛋白质之间相互作用与识别的主要内容之一,它可以对研究细胞中蛋白质序列-结构-功能的关系提供重要的理论参考价值,对蛋白质交互作用的研究、蛋白质复合物预测以及计算机辅助药物设计具有重要意义。目前使用基于蛋白质序列的方法来预测蛋白质-蛋白质和蛋白质-配体离子结合位点已经有了较为完善的方法。特别是随着蛋白质结构预测精度的不断提高,研究人员可以获得更高精度的蛋白质三维空间结构。进而可以构建精确的蛋白质结合位点预测模型。特征提取与选择是特征成功表示的重要一步,也是后续构建有效模型的关键组成部分。为了更有效的表达蛋白质序列信息,本文从特征提取和特征选择两方面对蛋白质金属离子和自由基离子信息表示的方法进行研究。本文通过提取蛋白质序列的PSSM打分矩阵、二级结构、氨基酸组成、CKSAAP结构信息、溶剂可及表面积、正负电荷等14种特征,然后通过串联方式将所有特征合并在一起得到一个高维、稀疏的矩阵来表达蛋白质序列的特征信息。接着本文提出一个加权特征选择方法(Weighted Feature Selection,WFS)对特征进行选择,并通过特征选取方法删去冗余和不相关的特征来进一步降维,减少算法运行时间。由于本文处理的数据集样本数量差别很大,为最大限度的提高特征选择的质量,最后本文分别使用卡方检验特征选择、sfm特征选择、随机森林特征选择、WFS特征选择四种方法对不同的数据集使用动态的选择策略。实验证明该策略有比较好的效果。在提取特征后,为了构建更为有效的预测模型,本文提出了一个基于Tscore得分和分类器不一致度量得分的多分类器动态选择集成模型。该模型分类两个阶段,单分类器排序和多分类器动态选择集成。在第一个阶段中首先使用分类器池中的单分类器分别对训练集进行训练,每个分类器得到一个Tscore得分,然后依据此得分对所有的分类器进行降序排列。在第二个阶段中依次在集成分类器池中选择单分类器,如果当前的集成分类器Tscore得分大于上一步的得分并且分类器不一致性度量指标大于某个阈值,则继续添加分类器,否则停止集成。最后将本文提出的方法应用到蛋白质金属离子和自由基离子结合位点预测的问题中,通过在公开数据集上进行实验,得到了较好的预测效果;然后与经典预测算法进行对比,验证了本文方法的有效性。
其他文献
气温变化改变了全球的水热资源现状,导致生物群落的组成和结构发生显著变化,进而对陆地生态系统的结构和功能产生深刻的影响。土地利用方式是世界范围内普遍采用的保护土壤肥
维氏硬度值在40 GPa以上的材料被称为超硬材料。超硬材料具有高熔点、耐磨损等优点,广泛地应用于切割工具、刨光工具以及抗磨损涂层等领域。目前,工业上使用最多的超硬材料是
复合磁性材料中存在多种磁相互作用,其中磁偶极相互作用成为近年来的研究热点。一方面,由于材料的几何形状和内部畴结构的变化都会使得内部相互作用机制的不同,从而影响材料的磁性能及应用;另一方面,由于巨磁阻抗(GMI)效应在低场下对磁场的响应非常灵敏,所以成为了研究软磁材料磁性能的重要手段之一,同时也用于磁偶极相互作用的研究。为了详细说明磁性复合材料之间的相互作用的机理,本文通过化学镀工艺制备了CoP/C
可见光通信(Visible Light Communication,VLC)是随着发光二极管(Light Emitting Diode,LED)照明技术的发展而兴起的一种无线光通信技术。由于白光LED拥有节能、寿命长、可靠
为研究黑胫病烟草根际土壤理化环境和其微生物多样性,了解其微生物群落的组成和结构,从而为健康植烟土壤生态系统构建和保持提供理论依据和指导,以2014‐2015年四川凉山州大
随着科学技术的迅速发展,稀土离子掺杂的上/下转换发光晶体已经作为新一代功能材料出现,它们具有优异的光学性能,如长发光寿命、低毒性、尖锐的发射带,且在生物成像、化学传感器、防伪和3D显示等方面展现出潜在的应用。然而对于其实际应用来说,有限的上/下转换发光效率还远远不够。因此,本论文的研究工作主要围绕“向稀土发光材料中掺杂异质离子Cu2+或Ca2+离子,使其上/下转换发光效率得到提高”来展开,具体如下
目的:癌症和昼夜节律之间的联系近年来引起了广泛的关注。BMAL1是调节昼夜节律的核心因素,其变异常与包括癌症在内的人类疾病有关。本研究旨在探讨东北地区人群中BMAL1基因三
当今社会,能源存储的环境友好性和可持续发展性越来越受到人们的广泛关注。迄今为止,锂离子电池技术因具有较高的比容量、较长的循环寿命、对环境友好、没有记忆效应等优势,
细菌性疾病是引起水产养殖生物大量死亡的主要原因之一,严重危害水产养殖业的可持续发展。银纳米粒子(AgNPs)具有杀菌作用强、广谱杀菌且不产生耐药性等特点受到广泛关注,可为
目的:采用适宜的环氧化方法,合成出一系列手性2,3-环氧丙醇类化合物,在手性2,3-环氧丙醇结构中引入磷酸酯基团,制备相应的2,3-环氧丙醇磷酸酯类化合物;对合成的3-苯基-2,3-环