糖肽质谱数据的无标记定量算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:chenfengling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
糖肽质谱数据的无标记定量算法是生物信息学中重要的研究内容之一。随着计算机技术的快速发展,使得面向糖肽质谱数据的无标记定量算法研究成为可能。为了完成计算机辅助的糖肽质谱数据无标记定量,本文解决的问题及主要工作如下:(1)针对峰簇混叠导致的峰簇分离提取易出错问题,本文结合离子同位素分布规则,提出了一种基于三维信息的多电荷混叠峰簇分离提取算法(3D-based Multiple-charges Overlap Peaks Extraction algorithm,3D-MOPE)。算法首先充分考虑了一级质谱中同位素峰簇混叠的情况;其次,利用糖肽离子的时间、质荷比和离子强度属性构造三维峰簇,并在三维空间中完成混叠峰簇分离提取,全面考虑了峰簇的所有特征。实验结果表明,本文提出的3D-MOPE算法在真实数据集上比Max Peak、Pep Quan和Max Quant算法的峰簇提取准确率分别提高了16%、13%及2%。(2)针对峰簇漂移导致的质谱数据中峰簇无法对准问题,本文提出了一种基于峰特征交叉融合的精确峰对准算法(Accurate Peaks Alignment algorithm Fusing Cross Peaks Features,APAFCPF)。算法包括两个步骤,首先构建了基于随机扰动的时间加权全局粗对准模型,完成糖肽离子粗对准,解决了粗校准过程中易受异常值影响的问题;其次,提出了峰特征交叉融合公式,并使用动态规划算法实现了峰簇精确对准。实验结果表明,在DS3数据集上本文提出的APAFCPF算法比IPTW算法、SFA-MS算法以及DTW算法在F1指标分别提高了0.08、0.14和0.06。(3)针对系统误差导致的定量结果准确率不高的问题,本文提出了一种高覆盖率、高正确率的糖肽质谱数据无标记定量算法(Glycopeptide MS Data-oriented Label-Free Quantitative Algorithm,GpMS-LFQ)该算法结合二三章的研究内容,首先基于峰簇信息计算糖肽离子的含量;其次,提出多模块归一化方法进行系统误差矫正,最终得到糖肽离子的定量结果。实验结果表明,在三次实验中本文的GpMSLFQ算法F1指标比Max Quant算法分别提高了0.51、0.27和0.20,比Byonic算法分别提高了0.24、0.02和0.08。基于该算法开发了一款糖肽无标记定量工具(Gp QT)。综上所述,本文以糖肽质谱数据为对象,研究糖肽无标记定量算法,可以为疾病诊断和生物标记物的发现提供依据。
其他文献
鬼成像作为一种新型成像方式,利用了光场的二阶关联特性计算出目标图像。由于这一特性,与传统成像方式相比,它可以实现在雨雪雾霾等较差的光学环境中抗散射成像,且抗噪性强。因此,在一些特定场景下,鬼成像比传统成像更具优势。然而鬼成像普遍存在的问题是其成像质量与采样次数成正相关,高质量的成像效果意味着极大的时间成本,本文从原理出发,利用深度学习方法从两个方向优化了计算鬼成像系统的性能。首先,针对利用计算鬼成
人体姿态估计是研究定位图像或视频中人的关键点(关节点),并连接相邻关联关键点的技术。姿态多样、光照变化和环境遮挡等是影响人体姿态估计精度的主要因素。提高人体姿态估计质量在实践中有迫切的应用需要。本文重点围绕基于深度学习的复杂人体姿态估计问题展开研究。在深入研究现有基于深度学习的人体姿态估计方法的基础上,提出一个新的关键点关联约束的复杂人体姿态估计网络KACNet。该网络充分考虑了人体相邻关键点之间
自然语言处理技术诞生于上世纪50年代,随着时间的推移,先后经历了基于规则的方法、基于统计的方法以及近十五年来基于机器学习和深度学习方法的迭代更新,几年前伴随着BERT的呱呱坠地又掀起了一轮新的研究热潮。文本分类是自然语言处理中的一项重要任务,它的核心是从文本中抽取出能够体现文本特点的关键特征,寻找特征到类别之间的映射。近年来,另一种基于图结构数据的文本建模思想不断的发展壮大。与BERT不同,图神经
彩绘文物是宝贵的历史研究材料。线稿作为彩绘文物的重要组成,反映了文物图案的绘画结构,在文物修复和保护传承中具有重要作用。传统的线稿提取主要采用人工临摹的方式,不仅效率较低而且临摹准确度也因绘画水平不同有所差异。而基于图像处理的线稿提取方法可以高效且客观的提取线稿,具有广阔的应用前景。但是由于彩绘文物病害较多,图像背景复杂,现有方法提取效果还有较大的提升空间。近期深度学习在图像处理领域广受关注,取得
多视图分析能够较好地利用不同视图之间信息的兼容性和互补性,比单视图分析具有更好的决策性能,目前广泛应用于计算机视觉、目标检测、行为识别等领域。然而传统的多视图分析大多只研究成对视图间的关系,忽略了所有视图间关系,导致得到的公共空间判别性不强。尽管一些非成对多视图方法得到了判别性公共空间,却使用广义特征值分解方法对其近似求解,使得最终结果偏离全局最优解。因此,人们希望既能得到判别性公共空间,还能得到
媒体经过了五代发展,成为典型的数字网络媒体。数字网络媒体作为新时期新媒体的代表,其数字化控制管理水平更高。在现代化的数字媒体设计中,数字化的管理为媒体艺术的发展提供了更加丰富的表现形式。在新媒体传媒的作用下,中国传统文化及艺术通过多元化的新媒体传播渠道传播到了世界各国,也收获了更大范围的群体,以及他们对中国传统文化艺术的认可和欣赏。这其中包含了丰富多彩的中国元素。随着中国文化和艺术在国际上的地位越
脑瘫是指一组由产前、产时或产后非进行性脑损伤所致运动和姿势发育障碍的活动受限性疾病。作为一种非侵入无电离辐射的检测工具,磁共振成像(MRI)能够提供较高的软组织分辨率和丰富的影像信息,适合用于新生儿脑病筛查。但是目前我国大多数基层医院新生儿头颅MRI检查仅能够提供常规的MRI模式。面对挑战,现如今基于深度学习的新生儿大脑图像分割算法存在两点不足:一是过于依赖数据集;二是加深网络层数的同时增加了模型
近年来,随着对神经网络的不断探索及移动手机硬件的更新换代,越来越多的研究聚焦于如何设计有效的模型,支撑起移动终端的任务推理。图片分类是众多研究中的经典任务,可用于以图搜图、人脸识别、医疗影像等诸多领域,在现实中有重大实用意义。而在移动端上进行图片分类主要面临如下两个问题:神经网络模型往往是参数量大且计算密集型的,存储和计算资源的开销给移动端带来了很大的负担;而移动端和云端结合的处理方式虽然高效,但
秦始皇兵马俑挖掘出土时大多已破碎残损,大量文物碎片拼接修复复杂,其拼接复原便成为复杂的数学问题,高性能模型智能处理方法研究成为推动该问题解决的关键。由于直觉模糊集同时考虑了隶属度、非隶属度与犹豫度这三方面信息,更加适合处理多碎片拼接过程中“匹配”程度上的不确定性,为受损俑体自身形状模糊表示、特征缺失的模型表示、受损俑体自身特征模糊不易提取表示问题提供技术支撑,实现精准建模,支持在模型特征空间上的系
生物系统蕴含着各种各样复杂的结构与功能,例如其内部固有的异质性和催化转化等。为了进一步阐明这些复杂系统中的各种生理机制,推进单分子生物技术的创新发展已刻不容缓。与传统的集成平均法相反,单分子纳米通道技术可以在高时空分辨率下追踪单个生物分子的动态行为。更重要的是,该方法具有同时获取多个分子指纹信息的独特功能,因而适用于复杂生物流体和微小差异组分的高通量多重分析。本论文以此为出发点,将嵌入仿生分子受体