蛋白质翻译后修饰及其相互作用预测方法研究

来源 :东北师范大学 | 被引量 : 12次 | 上传用户:vbcjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质翻译后修饰和蛋白质间的相互作用是蛋白质发挥正常生物学功能的基础,在生命体中具有十分重要的作用。由于实验研究手段欠佳和相关数据的零散不齐,尽管有350多种蛋白质翻译后修饰已经被实验所证实,仅有很少的几种蛋白质翻译后修饰被较好的研究。通过传统的实验方法鉴定蛋白质翻译后修饰位点既费时又费力,并且酶反应的优化又是一个极为耗时的过程,这些因素严重制约了相关研究的进展速度。因此,一些基于计算的方法逐渐被提出来,这些方法既可以高效地、准确地预测蛋白质的翻译后修饰位点,又可以对进一步的体内或体外的实验验证提供一些线索。而对蛋白质间相互作用的研究,将有助于从系统角度深入理解各种生物学过程,为进一步探索生物体疾病的发生机制提供可靠的数据来源,同时还可以为寻找新的药物靶标,新药研发开辟道路。本文针对蛋白质翻译后修饰位点及蛋白质间相互作用的预测方法进行了研究,主要成果如下:(1)提出了一种基于集成学习的蛋白质泛素化位点预测方法,首先采用四种类型的特征,来编码每一个赖氨酸位点及其相邻位点的氨基酸;接下来,为了减少计算复杂度并提高预测方法的准确度,采用了一种有效的特征选择方法筛选最优的特征子集;最后,利用筛选出来的最优特征子集建立了一个集成分类器,并对最优特征子集中进行了特征分析。与其它方法预测方法在公共数据集上的对比实验表明该集成分类器良好的预测性能。(2)通过提取有效的pupylation底物信息,建立了一个新的pupylation位点分类器。首先,对训练集中每个样本序列,提取五种类型的信息并对pupylation位点本身和它邻近的残基进行编码;接下来,对于这五种特征构成的集合,应用最大相关最小冗余(mRMR)和增量的特征选择(IFS)方法找出最优的特征子集;最后,基于最优特征子集,用最近邻算法(NNA)建模并预测pupylation位点,其留一法测试的预测准确率可以达到70.93%。通过对最优特征子集的生物学分析,研究发现进化信息和物理化学/生物化学属性在pupylation位点识别中发挥了极其重要的作用,位点7,10和11对pupylation位点识别的贡献最大。本文的工作结果表明:mRMR与IFS两种特征选择方法的结合能够有效地对生物数据集进行特征筛选,在此基础上的建模,既可以得到满意的预测性能,也容易发现所选特征的生物学意义。(3)首次将一种新的编码方式,k-spaced氨基酸对构成编码(CKSAAP),应用于预测磷酸化位点预测问题,并提高了磷酸化位点的预测准确度,通过与PPRED、DISPHOS和NetPhos这三种预测工具的比较,本章构建的CKSAAP_PhSite预测工具能够更加准确地预测磷酸化位点。CKSAAP_PhSite对丝氨酸磷酸化位点预测的敏感度是84.81%,特异度是86.07%,准确度是85.43%;对苏氨酸磷酸化位点预测的敏感度是78.59%,特异度是82.26%,准确度是80.31%;对酪氨酸磷酸化位点预测的敏感度是74.44%,特异度是78.03%,准确度是76.21%。实验结果验证了该方法的有效性和实用性,相应的特征分析表明CKSAAP编码方式能够有效地提取出磷酸化位点附近序列模式。基于该研究内容,建立了相应的在线预测工具。(4)提出了一种新的基于扩增的Chou’s伪氨基酸构成编码的蛋白质间的相互作用预测方法,首先采用了三组描述符来编码每一个蛋白质交互对;然后利用PCA技术对编码后的930个序列特征进行降维,经PCA降维后得到的特征子集不但包含很少的特征,而且还尽可能多地保留了原始特征集合的信息;最后,通过将降维后的特征子集作为输入向量,建立了一个基于支持向量机的蛋白质相互作用预测模型,并在黑腹果蝇数据集和幽门螺杆菌数据集上与其它预测方法进行比较,实验结果表明,本文提出的预测模型能够更加准确地预测蛋白质间的相互作用。
其他文献
本文以自由之可能这一哲学根本问题,对费希特的知识学理论的建构进行了深度阐释,并在此基础上对比了费希特的自由理论的结构与马克思以“对象性活动”概念为核心的自由理论,
在对西华山花岗岩及成矿长期研究基础上。根据近年钻孔和坑道揭露以及岩体的同位素等时年龄测定等成果资料,将西华山复式花岗岩体划分为燕山早晚两期、三个阶段、五次侵入体,进
单层二硫化钼(Monolayer Molybdenum Disulfide,ML-MoS2)是一种具有直接带隙的半导体材料,通过功能化修饰ML-MoS2,能够实现带隙在较宽范围内的可控调节,为其在光电磁器件方面提
在中国古代音乐的历史当中,唐代音乐无疑是占据了重要地位。梨园、太常寺、教坊合称为当时大唐的三大音乐机构,可见当时的梨园在唐代是有着极为重要的作用。本文主要是针对唐
随着网络技术的飞速发展,网络攻击愈演愈烈。为应对日益复杂隐蔽的网络攻击,通过协同、主动的方式有机结合多种防御技术的网络动态防御已成为网络空间安全领域的研究热点。异
频谱音乐强调以声音最初的物理性质作为作曲的出发点,认为声音并非静态的而是具有生命并随时变化的个体,声音具有诞生、伸展、消亡的过程。
<正>建筑综合体一般指综合体建筑由多个使用功能不同的空间组合而成的建筑。又称建筑综合体。分单体式(单幢建筑)和组群式(多幢建筑)两种类型。综合体建筑(building complex)
湘籍女歌唱家是民族唱法中一个特殊的案例,纵观民族唱法在我国各个省市的发展,都没有湖南省的演唱家群体那么具有代表性,自李谷一之后,相继有宋祖英、张也、吴碧霞、陈思思、
《金融业发展与改革"十二五"规划》提出要建立统一、全面的金融业综合统计体系,目前我国已经开展了金融业综合统计试点,并取得了积极进展,但仍然面临一些困难。本文针对我国
无功管理是高压直流输电工程设计的重要组成部分,无功设备投切顺序正确与否直接关系到直流输电工程能否安全稳定运行。文中描述了无功设备的投切原则和高压直流输电无功管理