论文部分内容阅读
代谢组学是20世纪90年代发展起来的对某一生物或细胞内的内源性代谢物进行定性和定量分析的一门技术。作为近几年来新兴起来的一门学科,代谢组学是“后基因组学”时期发展迅速的一种“组学”技术,是系统生物学重要的组成部分,它与蛋白质组学、转录组学和基因组学一样,已经成为热门的研究领域。各种化学分析技术、计量学和统计学的进步,促进了代谢组学的发展以及应用领域的扩展和深化。代谢物组是蛋白质组、转录组和基因组总体表达的结果,直接反映组织的生化状态,能够较灵敏地刻画生命体生理病理状态的变化,对于阐明生命复杂系统具有极为重要的意义。代谢组学已成为国际上疾病与健康研究的一个重要热点。因此,用代谢组学的方法来研究复杂疾病,对于疾病的早期诊断、预防、药物干预具有重要的指导意义。本文的研究目的是通过文献研究,了解代谢组学研究发展的进程、研究的临床应用以及它的发展趋势,同时将几种常用的数据处理方法用于代谢组学数据分析中,探讨几种数据分析方法在其中的应用。本文研究了代谢组学概念的演变过程及其发展进展、代谢组学的优点以及代谢组学研究策略的发展趋势。代谢组学与其他几种组学相比凸显了很大的优点,这也是它越来越受青睐的原因。代谢组学研究趋向于向整合化、定量化、标准化发展,特别是代谢组学数据处理的方法、工具、变量的选择等方面。代谢组学数据处理是代谢组学分析研究过程中比较关键的一个步骤,在这一步,可以对数据做出最终的解释和说明,得到明确的、有价值的信息。由于代谢组学研究的技术和成本的要求,通常代谢组学研究得到的数据具有小样本量、大自变量(研究因子)的特点。所以,根据代谢组学数据的特点选择合适的数据处理方法(统计方法)是必要的。但是,代谢组学目前并没有标准的、统一的数据处理方法。因此,根据具体研究情况,探索代谢组学分析的工具和方法是很多研究者热衷的,也是具有一定实用价值的研究。代谢组学在疾病研究方面的应用比较多,相比其他领域也比较深入。本文在研究以上代谢组学相关的理论和方法的基础上,做了冠心病心绞痛的代谢组学数据的分析。其中运用SPSS17.0软件进行统计分析。方法:(1)利用两样本的t检验,对冠心病心绞痛患者与未患者进行单因素的分析;(2)做Spearman相关分析(3)对两组代谢组学数据进行Logistic回归分析;(4)对冠心病心绞痛组和对照组分别做主成分分析(PCA);(5)对两组进行神经网络(NN)分析。结果:(1)通过t检验和Spearman相关分析,核糖醇,1-脱氧葡萄糖,葡萄糖肟,D-葡萄酸,软脂酸,肌醇,十七烷酸,硬脂酸,4羟基-嘧啶,柠嗪酸,辛二酸等16种代谢物组分有显著性差异(存在相关性),这几种代谢物组分在冠心病心绞痛组含量高于对照组;与冠心病心绞痛呈正相关;(2)Logistic回归分析表明,硬脂酸含量高是冠心病心绞痛的危险因素;(3)主成分分析显示,冠心病心绞痛组的软脂酸,硬脂酸,4羟基-嘧啶,十七烷酸含量较高。(4)神经网络分析结果显示,磷酸盐含量低是冠心病心绞痛的危险因素。总之,依据以上分析,应该可以看出冠心病心绞痛的危险因素有核糖醇,1-脱氧葡萄糖,葡萄糖肟,D-葡萄酸,软脂酸,肌醇,十七烷酸,硬脂酸,4羟基-嘧啶,柠嗪酸,辛二酸这些代谢物组分含量高,特别是硬脂酸,在几种方法中都比较明显。此外,磷酸盐含量低也是冠心病心绞痛的危险因素。不过,其中还有少数的几种未知的代谢物组分。在分析中,采用了“单变量-两变量-多变量”逐步深入的分析方法,思路清晰,由简入繁,最后结合几种方法,得到了比较好的分析结果。通过比较几种分析方法,本文认为在代谢组学数据分析时可以采用t检验或Spearman相关结合主成分分析的数据处理方法。当然,样本量大、变量多时结合采用神经网络分析也可以。使用多种数据分析手段,利用代谢组学检测技术,通过对代谢物的分析和综合,可以深入研究疾病的发病机制,具有重要的应用价值。