【摘 要】
:
近年来,基于串联质谱技术的蛋白质鉴定,逐渐成为蛋白质组学研究中的关键问题,而质谱数据的预处理是其中不可忽略的问题之一,因为质谱中的大量噪声使得鉴定时间的增加和精度的
论文部分内容阅读
近年来,基于串联质谱技术的蛋白质鉴定,逐渐成为蛋白质组学研究中的关键问题,而质谱数据的预处理是其中不可忽略的问题之一,因为质谱中的大量噪声使得鉴定时间的增加和精度的下降,而且同位素峰的存在也会使肽鉴定的准确性和可靠性受到影响。本文主要针对低精度的离子阱质谱数据,研究了串联质谱数据的预处理问题,包括质谱中的强度基线水平的确定和同位素质峰的识别问题。第二章首先简单介绍了质谱技术的基础,包括质谱仪的原理、组成和数据处理等,随后详细介绍了基于串联质谱的蛋白质鉴定方法,分析了质谱数据预处理的必要性,并总结了现有预处理算法不足,比如不能根据每个质谱的不同特点来获得基线。在第三章中,论文提出了一种自适应地确定谱峰强度基线的方法。通过大量观察发现,不同质谱中谱峰强度的分布范围是有差别的,但是在形式上低强度的噪音峰都近似服从高斯分布,而离子峰则近似服从伽马分布。据此给出了一个期望最大化即EM学习算法和一个快速近似算法自适应地估计每个质谱中噪音峰强度的分布参数,从而确定噪音基线水平。实验结果表明,与固定基线方法相比,自适应基线方法能够在相同数据缩减率下提高肽鉴定的准确度。在高精度质谱仪产生的质谱数据中,同位素谱峰非常明显,相对容易识别。而在低精度的离子阱质谱中,同位素峰则非常不明显甚至缺失,因此尚缺少有效的识别方法。本研究发现,离子阱数据中的同位素峰实际上仍有规律可循。论文第四章首先给出了第一同位素与单同位素峰在质量和强度方面的多种约束关系,并据此构造出谱峰的特征向量表示,然后提出利用机器学习中的决策树方法对谱峰的类别进行学习和预测。在多个数据集上的实验表明,通过将识别出的同位素峰去除,在相同的肽鉴定假阳性率下,鉴定出的肽段数量明显增加。论文最后将新算法集成到pFind系统的质谱数据预处理模块中,并进行了大量实验,实验结果表明,进行预处理后,pFind在鉴定速度上提高15%的同时,在相同肽鉴定假阳性率下,鉴定出的肽段数量有所提高。
其他文献
将传统文化和现代广告设计相结合,是对广告的形式上和内容上的展现民族传统文化的大胆表述。是现代广告设计的源泉,也是现代广告设计的的强大精神支柱。传统文化是中华民族在
目的:观察平乐郭氏荣肌揉筋法治疗创伤后肘关节功能障碍的康复疗效。方法:76例创伤后肘关节功能障碍患者均采用四自疗法(自捏、自摩、自拿、自锻炼)及郭氏荣肌揉筋法治疗,治疗前
习近平总书记在全国文物会议上指出:“文物承载灿烂文明,传承历史文化,维系民族精神,是老祖宗留给我们的宝贵遗产,是加强社会主义精神文明建设的深厚滋养。”文化遗产,作为国家文明的精神象征,凝聚了历史文化的精华所在,展现了劳动人民的技艺水准,在继承及传播中华文化中起着不可代替的重要作用。近年来,随着互联网技术的兴盛及数字活化浪潮的洗礼,文化遗产以“因循守旧”与“文物展示”为中心的传统场域逐步瓦解,而“交
<正>一、从宏观而客观的历史大事变到微观而主观的生活小事情列斐伏尔的日常生活批判理论,就其在整个现代西方社会思想中的位置来说,位于海德格尔、萨特的存在主义的日常生活
中药药剂学实验课程在中药药剂学课程教学体系中占有非常重要的作用。就近些年中药药剂学实验教学过程中存在的问题提出一些改革的措施,以期进一步提升实验教学水平,提高教学
以树干毕赤酵母(Pichia stipitis)1960(Ps1960)与酿酒酵母(Saccharomyces cerevisiae)AADY(ScA ADY)为亲本菌株,采用双亲灭活原生质体技术制备木糖利用融合子,并对其制备条件
探究硒元素对南美白对虾生长性能和免疫活性的影响。在动物饲料中添加富硒酵母,配制成不同浓度的有机硒饲料,饲养后检测动物体的生理指标和抗氧化酶的活性。结果表明:实验组
<正> 赵某,男,60岁,农民。于1990年8月16日就诊。患者近年来常大便不爽,小腹不适,便意频作,日行数次,呈粘液稀便,偶有成形,状如面条,时轻时重,缠绵不愈。3个月前因情志不遂病
分布式技术重点解决异构环境下的互操作性,传统的分布式异构环境操作不但烦琐,而且通用性很差。提出了基于Web服务技术进行异构环境下的互操作观点,介绍了Web服务的体系结构
目的了解该院门诊中成药使用情况,为规范处方书写和合理使用中成药提供参考。方法抽取2014年该院中成药处方21 442张中的不合理处方572张,对中成药基本情况、联用情况、科室