基于多级质谱的糖分支结构鉴定算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jiaojiao82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
糖类作为生命体中的重要大分子,在一系列生命活动中扮演极为重要的角色。与蛋白质的直链构型不同,糖是分支构型的树形结构,这使得糖的鉴定非常困难。质谱技术的高灵敏度、高特异性使其成为鉴定糖分支结构的主要手段。  目前常用的基于质谱技术的糖结构解析算法主要分为谱库搜索方法、结构库搜索方法和De Novo方法。现有的结构库搜索方法和De Novo方法都是基于二级质谱的。但是,二级质谱对糖分子碎裂不充分,往往无法得到唯一的鉴定结果。而近期研究表明多级质谱有能力唯一鉴定糖分支结构。  另外,王耀君等人提出了智能选峰算法GIPS,采用了多级质谱策略,取得了很好的结果。但是他们的研究在证明方法的鲁棒性与可靠性上仍显不足,主要有三个问题:算法参数设置未充分说明、可重复性存疑以及没有在复杂生物样品上测试。  针对GIPS研究上的不足,本文进行了进一步实验探究;针对现有结构库搜索方法无法得到唯一鉴定结果的问题,本文提出使用多级质谱的结构库搜索算法GIS;针对现有De Novo方法均没有使用多级质谱的问题,本文提出了使用多级质谱的De novo算法gNovo。具体成果如下:  (1)验证了GIPS算法的鲁棒性与可靠性  本研究对GIPS算法进行了鲁棒性验证,在不同参数取值下对GIPS算法进行了测试。测试表明不同的参数取值并不影响GIPS算法的鉴定结果,为之前研究中参数的选取提供了依据。本研究还在13个标准糖样品上重复了整个GIPS多级质谱糖结构鉴定流程(包括多级谱实验),证明了GIPS糖结构鉴定流程具有良好的鲁棒性。本研究还使用GIPS鉴定人类血清中的的糖结构,成功鉴定了57个糖结构,证明了GIPS算法在复杂样品上的可靠性。  (2)提出了多级质谱糖结构结构库搜索鉴定方法GIS  本研究提出了一种基于多级质谱鉴定糖结构的结构库搜索策略GIS。GIS定义了一个鉴定糖分支结构的算法流程,包含一个对多级质谱谱图与谱峰的筛选方案,一个多级质谱谱图标注算法以及一个候选结构打分算法。多级质谱谱图标注算法充分考虑了同位素峰丰度分布。候选结构打分算法使用谱峰的两个特征来衡量峰的可靠性:理论与实际的同位素峰丰度分布的相似性和标注峰的丰度。GIS成功鉴定了17个标准糖样品,4个从RNase B上分离的糖样品与11个从人类免疫蛋白上分离的糖样品,证明了GIS算法的有效性。  (3)提出了多级质谱糖结构De Novo鉴定方法gNovo  本研究提出了一种基于多级质谱鉴定糖结构的De Novo搜索策略gNovo。gNovo定义了一个鉴定糖分支结构的算法流程。gNovo包含多级质谱标注算法,糖结构拼接算法与候选结构打分算法。多级谱标注算法基于单糖成分进行碎裂标注并生成整体结构的子图限制,简化了之后的拼接步骤,加快了拼接速度。拼接算法实现了在标记算法得到的糖结构子图限制条件下搜索候选结构,充分利用了多级质谱信息,实现了快速而准确的拼接。候选结构打分算法衡量了候选糖结构各个分支间的平衡性,候选结构分支间越平衡,候选结构打分越靠前。本研究使用gNovo鉴定了12个标准糖样品,实验结果表明gNovo对大多数样品鉴定结果较好。
其他文献
现场总线控制系统是目前自动化技术中的一个热点,受到国内外自动化设备制造商和用户越来越强烈的关注。现场总线控制系统的出现,将给自动化领域带来又一次革命,其深度和广度
听力语言残疾人士是最需要国家和全社会都来关心和帮助的特殊群体之一。手语是听力语言残疾人最重要的交际手段。随着社会的进步,特别是聋教育的发展,手语越来越被社会所接受。
机群结构由于具有良好的可扩展性、可用性、高性价比等优势已经成为高性能计算机的主流结构。然而,由于磁盘访问性能仍远落后于CPU、内存和网络传输性能,机群系统的I/O性能往往
随着Internet中Web服务技术的飞速发展,具有相同功能的Web服务的数量也与日俱增。在这种条件下,服务使用者在选择服务时,不仅关心服务的功能,而且关心服务的非功能因素,特别
学习分类系统是一种自适应的规则产生式系统,能够动态感应环境、模拟认知。它利用环境反馈评估种群中的分类规则并通过遗传算法对种群进行进化。经过近三十年的研究,学习分类系
多目标优化问题一直是科学和工程领域的一个难题和热点问题,在进化算法应用到这一领域以前,已经产生了许多传统的方法,传统的方法存在探索未知空间的能力不强,容易陷入局部极值点
随着数字图像数量的急剧增长,如何能高效、快速地从海量图像数据中检索出用户所需的信息是当前图像应用领域的一个重要问题。从目前研究现状来看,图像视觉内容的索引一般可以
本文工作的目标是要基于网络测量的方法建立一个尽可能完善和准确的从IP地址到地理位置的映射关系。但目前基于网络测量的IP地理定位大都依赖于往返时延与地理距离间较强的线
立体匹配是立体视觉中的关键技术之一,其核心问题是将同一个空间物理点在不同图像中的映像点对应起来。立体匹配是三维重构的基础,匹配的结果直接关系到三维重构的效果。但由
无线移动视频由于其带宽有限以及移动终端设备本身处理器频率和电池能耗的限制,对视频压缩提出新的要求,要在较高的压缩比例下,减少计算复杂度,并取得令人满意的视觉效果。一方面