基于深度学习的串联质谱蛋白质鉴定方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:pigdun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于串联质谱的肽鉴定是蛋白质组学的关键算法之一,而蛋白质序列数据库搜索是目前常用的肽鉴定方法。在传统的蛋白质序列数据库搜索中,通常需要先对每个肽段进行理论谱的构建,只考虑了质荷比的信息,但是与同位素峰值强度相关的信息被忽略了。近年来,随着人工智能技术的飞速发展,基于深度学习的MS/MS谱预测工具显示出了很高的准确性,在提高蛋白质序列数据库搜索的灵敏度和准确性方面具有很大的潜力。本文针对传统的蛋白质序列数据库搜索方法,通过考虑同位素峰强度相关信息对搜索流程进行优化,主要研究内容包括以下两个方面:(1)评估常用基于机器学习、深度学习的谱预测工具。利用机器学习或深度学习模型进行谱图预测是计算蛋白质组学的一种新兴方法。基于深度学习的MS/MS谱预测工具在提高data-dependent acquisition(DDA)搜索引擎的灵敏度和准确性,以及建立data-independent acquisition(DIA)分析的谱库方面具有巨大的潜力。不同的工具有其独特的算法和实现,可能会导致不同的性能。因此,有必要对这些工具进行系统的评估,以找出它们的偏好和内在差异。在本研究中,我们使用具有不同碰撞能量、酶、仪器和物种的多个数据集来评估基于深度学习的MS/MS谱预测工具和基于机器学习的MS2PIP工具的性能。我们发现p Deep2和Prosit在大多数情况下都优于其他工具,而且不同的工具都有自己的特点。例如,Prosit在预测Lumos产出的质谱方面效果最好;p Deep2在预测Q Exactive产出的质谱方面效果最好。我们还评估了深度学习工具在GPU和CPU上的预测时间。使用GPU时,预测速度极快;当只使用CPU时,对于许多任务,预测速度仍然可以接受。(2)利用深度学习优化蛋白质序列数据库搜索方法。我们选择使用深度学习模型(p Deep2)来预测所有候选肽的理论质谱,并将预测得到的碎片离子强度作为肽鉴定的比较参数之一应用于蛋白质序列数据库搜索工具(Deep Novo)中。在Deep Novo中,我们对模型的输入输出中间过程进行调整,将p Deep2与Deep Novo结合,从而提高了肽识别的敏感性和准确性。结果表明,在考虑了同位素峰强度后的肽鉴定,在氨基酸和肽水平上的召回率和准确率都提高了约2%。通过评估谱预测工具,我们系统地总结了各谱预测工具的性能。我们希望评估结果可为相应的研究人员提供频谱预测工具的思路和指导。p Deep2与Deep Novo结合的结果也表明,考虑同位素峰强度能够有效提高肽鉴定准确性和谱图解析率。
其他文献
目的观察内痔结扎切除术治疗三期内痔伴前列腺肥大、排尿困难的临床疗效.方法将113例患者分为治疗组(6 3例)和对照组(50例),治疗组采用内痔结扎切除术为主,配合服药、敷药治疗,对照组单纯采用服药、敷药保守治疗.结果治疗组总有效率为9 6.8%,对照组为7 8%,两组有显著性差异(P<0.05).结论内痔结扎切除术治疗三期内痔伴前列腺肥大、排尿困难有明显效果,通过进行内痔结扎切除,三期内痔的症状、
企业制度创新与职业企业家郭霖一、现代意义上的企业即所有权与控制权的分离是企业家阶层产生的基础根据现代产权经济学理论,企业作为一种组织的出现是节约市场交易费用的非市
随着这几年的汉语热很多国家都开设了中文课或汉语课。印尼山口洋市也不例外开设了汉语课。山口洋是一个印尼华人人数较多而且以客家方言为常用语的城市。为了让学生能掌握好
目的总结胸腹联合伤诊治的经验.方法经开胸手术1 4例,其中3例先剖胸后剖腹,11例先剖腹后再剖胸.开腹手术加胸腔闭式引流21例.结果治愈31例.死亡3例.结论胸腹联合伤均需短时间
选育单位山西省农业科学院作物遗传研究所品种来源203—279×203—204,原名并单12号。特征特性植株高大,生长整齐健壮,株形紧凑,叶片上冲,株高300cm左右,穗位120cm左右,穗长22.5c
学前教育与小学教育衔接作为教育的第一个衔接环节,关系到整个教育过程的连续性。以幼小衔接为视角、以小学低段阅读教学为研究领域,通过对幼儿园和小学教师以及学生的随机访
硫酸镁的传统作用为口服可导泻、利胆,注射能降压、抗惊厥,随着对镁离子对人体生理及相关疾病发病机理的研究的进一步深入,发现镁离子在体内能激活数百种酶,参与核酸合成和细
文章对英语“同级”、“比较级”和“最高级”的语句手段以及本身带有“比较”意义的动词、形容词、副词和介词等词汇手段来表达比较,进行了叙述和探讨,以期找出其中的规律。