基于质谱数据分析的蛋白质鉴定——断裂模型、磷酸化肽段以及谱库搜索方法的研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:xushuai880620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
串联质谱(Tandem Mass Spectrometry)已成为蛋白质序列鉴定的重要方法,生物实验和质谱技术结合能在短时间内产生大量的质谱数据,远超过了人工分析的能力,因此需要借助计算机对质谱数据进行分析。目前基于串联质谱数据的蛋白质鉴别方法主要有数据库搜索(database search)方法、De Novo方法和肽段序列标签(peptide sequence tag)方法。其目标是从实验质谱推断未知肽段的氨基酸序列,其中理论图谱预测是关键一步。但仅仅有对肽段断裂机制的定性认识对理论质谱预测是不够的,还必须定量分析影响断裂的因素,如断裂肽键位置和断裂肽键种类等,从而提高理论图谱预测的精确度,进而提高蛋白质鉴定的准确度。   蛋白质磷酸化是生物体内一种最重要的翻译后修饰,控制着大量的生命活动。因此,对磷酸化的研究具有一定的现实意义,而研究磷酸化肽段的断裂规律有助于磷酸化肽段的鉴定和磷酸化位点的确认。   鉴于理论质谱预测的复杂性,质谱数据库(mass spectrum library)鉴定方法逐步应用于蛋白质鉴定领域,该方法避开了蛋白质鉴定中理论图谱预测这一难点,而是采用直接的谱-谱比较,但存在搜索速度慢、匹配不够精确以及存储图谱所需的内存空间较大等一些列问题,影响蛋白质鉴定的效率。   针对上述问题,本研究进行了如下尝试:   1.提出了肽段断裂的新模型:   在理论质谱预测中,为克服估计b/y离子比例的困难,本研究提出了一个肽段断裂的新模型-断裂模型,即不去具体估计b/y等离子的强度,而是直接估计各个肽键断裂的可能性。该模型同时考虑肽键位置和肽键种类的影响。采用迭代算法对多组质谱数据集合进行了测试。实验结果表明:迭代算法学习出的参数和已有定性观察有很好的吻合;预测的理论图谱更为精确。   2.探索磷酸化肽段的断裂规律:   将断裂模型应用于标注好的磷酸化肽段质谱数据集,通过迭代算法鉴定磷酸化肽段,同时学习磷酸化肽段的断裂规律。实验结果表明:应用断裂模型的迭代算法能较好地鉴定磷酸化肽段,并揭示出磷酸化肽段与非磷酸化肽段在断裂规律上的不同。   3.建立了一套基于谱库搜索的蛋白质鉴定新方法:   我们对收集到的大量质谱图进行分类和标注,然后对可能为同一肽段的图谱进行合并,生成合理的合成谱,然后建立有效的索引,即所谓的图谱“指纹”技术,最后通过精确打分从谱库中找到与输入图谱最相似的匹配。实验结果表明:该方法具有搜索速度快、存储空间小和计算复杂度低等特点;在单个CPU下每秒可搜索107张图谱。
其他文献
常用的雾化喷嘴虽然结构简单,但喷射压力高、雾化质量较差。空气雾化喷嘴是一种广泛应用于液体雾化的装置。其主要特点就是在喷嘴内部设计了空气流道,利用高压空气的喷散作用,以
莱克多巴胺作为一种新型促进生长添加剂可能在畜产品生产中使用,但是当人体内残留的莱克多巴胺累计量超过一定值时,易出现毒副作用。基于动物源性食品基质的复杂性和兽药残留的
期刊
随着学科的发展,用数值分析方法研究流体流动与传热学得到越来越广泛的应用。近20年来,随着计算机硬件的发展给数值模拟提供了硬件基础。从而逐渐使得数值方法成为一个具有完整
太阳能、风能、水能、电能、热能、机械能等能源之间的转化很多都是依靠叶轮机械来完成的。叶轮机械广泛的运用了国民生活中,例如,化工、农业、冶金、矿井、制药、电力等各个领域,而叶轮机械中非常重要的一类机械是风机。有关资料显示,我国风机消耗的能源占煤炭消耗量的12%左右。轴流式通风机相对于离心式通风机有很多优势的地方,如今在很多关键产业、关键位置中,离心式通风机逐步被轴流式通风机所代替。因此,提高轴流式通
由于受地形和气候等因素的影响,我国是输电线路覆冰严重的国家之一,世界上美、加、法、俄、日、韩等也都是频遭冰灾袭击的国家。另外,随着电网建设的不断推进及全球极端气象的不断出现,输电线路覆冰问题将会更加凸显,其给电网造成的运行安全问题与经济损失将会更加巨大。因此,研究覆冰机理,解决覆冰问题,具有重要的工程应用前景、具有重大的经济效益与社会效益。本文首先概述了关于导线覆冰国内外的研究现状及动态,总结了现
循环流化床燃烧技术因为其自身的优越性得到了迅速发展,并得到了大规模的商业。近些年来,随着化石燃料的利用形式日益严峻,生物质等新能源逐渐走进人的视野并得到广泛关注。而循
本文通过对荣华二采区10
期刊