蛋白质功能位点及相互作用位点预测

来源 :北京大学 | 被引量 : 0次 | 上传用户:zengguiyeah3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在后基因组时代,对于蛋白质功能位点和相互作用位点的预测是一个重要的研究课题。这些位点的识别对于认识蛋白质功能机制有着重大的意义。 我们设计并实现了基于分层随机语言模型的算法,从序列数据出发对激酶这种特殊的蛋白质的功能位点进行预测。同时,基于已知的蛋白质相互作用数据,我们使用AdaBoost方法来发现可能的蛋白质相互作用位点。 在对于激酶功能位点预测的问题中,我们将预测结果与PROSITE数据库中的特征串和PDB数据库中的配体结合区域进行了比较。在这两组比较中,基于分层随机语言模型的算法的平均敏感性以及平均特异性分别为83.5%/23.0%和66.1%/79.9%。在针对激酶功能分类进行的10折交叉验证中,分层随机语言模型达到了更高的敏感性(94.7%)和特异性(94.0%),而与之相比较的MEME敏感性为94.5%,特异性为85.8%。与Pfam中蛋白质结构域数据的比较也显示我们的结果更能够反映激酶家族的特征。分层随机语言模型能够自动对激酶子类进行识别,识别出的子类与序列系统发育树能够很好的吻合,这说明我们的方法可以很好的处理具有相同催化功能但是结构不同的序列数据。 对预测得到的蛋白质相互作用位点,我们则使用了PDB数据库中的多链蛋白质结构和iPfam中的蛋白结构域相互作用数据进行了验证,验证结果显示相对于传统的统计方法,我们的预测位点具有更高的显著性。在蛋白质相互作用预测的交叉验证中,相对于朴素的贝叶斯模型(32.08%/87.38%)和一种改进的贝叶斯模型(54.85%/87.14%),我们的方法在敏感性和特异性上都获得了更好的结果(66.42%/87.38%)。
其他文献
复杂疾病严重危害人类健康,其危险因素分析十分重要,是科学研究的前沿领域之一。本文主要讨论复杂疾病危险因素分析中的若干统计问题,包括:危险因素建模中的稳健的变量选择问题;遗
学位
本论文是关于随机微分方程的应用及其算法的研究。其内容主要分为两部分:第一部分为随机微分方程理论在DNA高分子链弹性研究方面的应用,第二部分为在多孔介质流体背景下随机微
校园文化指的是学校所具有的特定的精神环境和文化气氛,它包括校园建筑设计、校园景观、绿化美化这种物化形态的内容,也包括学校的传统、校风、学风、人际关系、集体舆论、心
遗传算法作为一种借鉴生物界自然选择和自然遗传机制的高度并行、自组织、自适应的搜索算法,由于其隐含并行性和收敛的全局性两大显著特点,使其尤其适用于处理传统搜索方法难
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
边缘检测是图像处理的重要内容。由于小波变换具有的多尺度特性,图像的每个尺度的小波变换都提供了一定的边缘信息。所以通过小波多尺度提取图像边缘是一种非常有效的方法。
本文首先研究分数阶耗散型方程的Cauchy问题:{ut+(-△)αu=F(u),(t,x)∈R+×Rn,u(0,x)=φ(x),x∈Rn.   许多经典偏微分方程是其特例,如:   (1)半线性分数阶耗散型方程ut+
学位
切换系统在过去几十年中吸引了系统工程师、计算机和数学家们的广泛关注,它是若干个由一组微分方程或差分方程所描述的子系统以及一个切换信号组成,并根据设计的切换策略在子系
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
本论文针对滑坡预报中存在的两个关键问题展开了研究,一、如何有效地剔除影响滑坡预报准确度的虚假噪声;二、如何根据各个预测模型的预测结果整合出一条综合信息。在研究过程中