ATP与蛋白质结合位点预测

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:daifei147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对蛋白质的不断深入研究发现,蛋白质与小分子或配体结合的现象普遍存在,尤其蛋白质与能量分子的结合更是广泛存在与各种生命现象中,因此研究蛋白质与配体结合的特性和规律是十分必要的。本文基于从蛋白质与ATP结合的氨基酸序列出发,采用了前人整理的数据库,并对数据库进行统计分析提取出序列特征信息。选取恰当的特征参数,用不同的分类算法对ATP结合位点进行识别,最后得到较好的预测结果。  本文共分为三个部分:  第一部分是对数据库的介绍和特征分析。本文选用的是经Dr.G.P.S.Raghava整理和使用过的168条非冗余的ATP与蛋白质结合氨基酸序列。在这个数据库中以小写字母表示ATP与蛋白质的结合位点。本文是对具体位置的预测因此需要把序列截成片段。因为对位点的预测是个二分类问题,以长度为11的片段为例:本文将片段的中心位置是结合位点的片段作为数据的正集,其他片段作为负集。本文共选取了从5到23的10个不同长度片段。在特征分析方面,本文将片段的氨基酸组分、位点氨基酸组分、紧邻二联体组分、氨基酸的物化性这些参数进行了统计分析和比较。  第二部分是理论方法。本文选用了多样性增量方法(ID)和支持向量机方法(SVM),多样性增量方法的好处是不需要学习和记忆,最重要的问题就是参数的选取。而支持向量机方法需要学习和记忆但却很适合对小样本进行分类,且分类效果很好。  第三部分是对ATP与蛋白质结合的位置进行预测。首先用ID方法选取片段的氨基酸组分和片段紧邻二联体组分作为参数预测,结果表明用ID方法预测精度较低,其次用SVM方法选取同样的参数进行预测,结果表明精度比用ID方法有所提高。在此基础上我们对片段的氨基酸组分用多样性增量方法进行了降维处理,并对20种氨基酸重新约化为6种,用约化后的氨基酸组分ID值和约化后的氨基酸紧邻二联体的ID值共同作为特征参数,再用SVM预测,得到较好预测精度。
其他文献
随着各种新型材料如左手材料、纳米吸波材料和导电高聚物等的快速研制成功,以及不同领域新技术如等离子体、仿生和微波传播指示等得到广泛研究和应用,有关实体目标的低可探测技
现今社会,网络技术的飞速发展,极大地促进了网络资源的共享,同时也导致人们需要面对的信息海量增长。因此,如何从这些信息中准确快速地找到有效信息,成为人们不得不面对的一个问题
11月7~10日,第十三届中国国际农产品交易会(下简称农交会)在福州召开,第四届绿色农药博览会作为本次农交会的重要组成部分同期举办,第十二届全国人大常委会副委员长张宝文宣
糖尿病是一种常见的代谢内分泌疾病,近年来发病率显著上升,目前全世界约有10%的成年人身患此病,因此需要通过便携式血糖仪来追踪、评估糖尿病。而目前大多数血糖仪,当采血量少时,它
亚波长金属波导结构是一种特殊的波导结构,它能突破传统光子器件受衍射极限的限制,从而实现纳米尺度的光学元器件。亚波长金属结构能够产生表面等离子激元,目前它已成为微纳光学
随着便携式设备的发展,待机时间成为电子产品性能的一个重要指标。电池能量密度的发展速度远远落后于便携式设备对功耗的要求,因此高效率的电源管理成为业界关注的重点。作为电
本研究从酸奶发酵菌株——保加利亚乳杆菌、嗜热链球菌以及单核细胞增生李斯特菌的混合培养特性出发,研究了乳酸菌及其代谢产物和乳酸链球菌素(Nisin)对单核细胞增生李斯特菌的
在无线通信接收机中,信号的传播常常会受到接受距离远近、是否有障碍物、电磁干扰等各种各样的外界因素影响,这些影响会使接收机中接收到的信号强弱变化较大,而ADC很难处理一
本文对革兰氏阳性中度嗜盐菌响应渗透胁迫的差异蛋白质组学进行研究,文章采用差异显示蛋臼质组学的研究策略,对长期盐胁迫下和不同渗透压仲击下中度嗜盐菌的蛋白质表达谱进行比
人体动作识别是当今机器视觉领域的研究热点,它涉及到图像处理、模式识别、人工智能等多个学科的相关知识。基于视频的人体动作识别包括人体区域检测、动作及姿态分割以及用于