论文部分内容阅读
目的优化弱阳离子交换磁珠(MB-WCX)联合基质辅助激光解析电离飞行时间质谱(MALDI-TOF-MS)建立尿液多肽谱的实验方法,建立代谢综合征(MS)早期肾损害尿液多肽谱。方法(1)探讨尿液采集方式、溶解温度、pH值、样本上样量、样品靶和质谱数据采集方式对磁珠联合基质辅助激光解析电离飞行时间质谱(MB-MALDI-TOF-MS)建立尿液多肽谱的影响,评估实验方法的重复性;(2)尿液样本来源于2008~2009年北京平谷地区“代谢综合征肾脏损害”流行病学研究。MS按美国国家胆固醇教育计划的成人治疗专家组Ⅲ(ATPⅢ)诊断标准,MS患者20μg/min≤尿白蛋白排泄率(UAE)<200μg/min和估算肾小球滤过率(eGFR)≥60ml/min.1.73m2则为早期肾损害。入选者分为健康对照(组Ⅰ)、MS合并正常白蛋白尿组(组Ⅱ)和MS合并微量白蛋白尿组(组Ⅲ)。应用MB-MALDI-TOF-MS方法建立三组样本尿液多肽谱。结果(1)MB-MALDI-TOF-MS建立尿液多肽谱的优化实验流程包括:收集过夜段尿标本、常温溶解、上样量30μL、点靶Polished steel target及手动模式采集数据;该实验方法日内变异系数为7.7%~14.2%,日间变异系数为7.9%~23.0%。(2)165例入选者中组Ⅰ65例、组Ⅱ54例、组Ⅲ46例,采用优化的MB-MALDI-TOF-MS建立了三组尿液多肽谱。结论本实验建立了灵敏度较高、稳定性较好的MB-MALDI-TOF-MS实验流程,适合高通量的临床蛋白质组学研究。应用该技术建立了正常人、MS合并正常白蛋白尿及MS合并微量白蛋白尿的尿液多肽谱。目的应用生物信息学方法筛选差异多肽峰并建立MS早期肾损害的尿液诊断模型,对尿液多肽标志物进行序列鉴定。方法两种方法进行数据分析:(1)三组样本分别分为training组和testing组,ClinProTools 2.1中统计学方法筛选差异多肽峰,遗传算法(GA)分别对组Ⅰ和组Ⅲ、组Ⅱ和组Ⅲ的training组数据构建诊断模型,采用10倍交叉验证评估模型的诊断能力;用testing组数据进行外部验证评估模型的预测能力;(2)Matlab7.10.0中的随机森林(RF)算法筛选差异多肽峰,支持向量机(SVM)算法对组Ⅰ和组Ⅲ、组Ⅱ和组Ⅲ及三组数据分别构建诊断模型,采用10倍交叉验证和ROC曲线评估模型的诊断能力。应用线性离子阱静电场轨道阱质谱仪(LTQ Orbitrap Velos)对尿液差异多肽峰分别进行鉴定,分析多肽标志物的生物学功能。结果(1)组Ⅰ和组Ⅲ多肽谱比较,GA算法构建诊断模型10倍交叉验证敏感性100%、特异性92.1%、准确性95.9%,外部验证敏感性76.2%、特异性80%、准确性78.4%;SVM算法构建模型的敏感性82.0%、特异性90.9%、准确性87.3%, ROC曲线下面积(AUC)为0.924。两个模型共同包含四个多肽峰:m/z 2755.97、3016.72、9076.41和11728.45;(2)组Ⅱ和组Ⅲ多肽谱比较,GA算法构建诊断模型10倍交叉验证敏感性100%、特异性87.5%、准确性93.4%,外部验证敏感性71.4%、特异性73.1%、准确性72.3%;SVM算法构建模型的敏感性89.2%、特异性81.1%、准确性85.5%,AUC为0.911。两个模型共同包含四个多肽峰:m/z 2755.97、3016.72、9076.41、10052.09;(3)三组多肽谱比较,SVM算法构建诊断模型准确性64.5%,包含8个多肽峰:m/z 2048.72、2562.67、2755.97、8779.30、9076.41、10052.09、10530.43和11728.45。(4)三个多肽峰m/z 1884.33、2562.67和2661.41均为纤维蛋白原α链的肽段。m/z 2562.67在组Ⅱ和组Ⅲ表达上调,m/z 1884.33和2661.41在组Ⅱ表达上调。结论通过两种生物信息学方法构建的模型均具有较好的诊断能力。鉴定得到了差异肽段m/z 1884.33、2562.67和2661.41的序列并鉴定为Fibrinogen alpha chain的多肽片段,可能是MS早期肾脏损害尿液多肽标志物,参与了MS及MS肾脏损伤的致病过程。