论文部分内容阅读
研究背景及目的:近年来结核病再次呈现区域性暴发的趋势,全球每年新增确诊肺结核患者多达856万例,其中5-15%的患者发展成活动性肺结核。在结核分枝杆菌(Mycobacterium tuberculosis,MTB)感染肺部后,机体产生的一系列免疫应答对活动性肺结核的发生及发展至关重要。同时,结核分枝杆菌的基因型与表达型差异变化巨大,传统着眼于单一分子变化的“还原论”研究模式以及目前临床应用的结核诊断靶标已经无法满足当下结核感染早期诊断的需求。因此,整合多学科优势,构建活动期肺结核免疫应答基因调控网络,高通量筛选体液中结核感染的诊断靶标,对深入探究人感染结核分枝杆菌后的特异性免疫应答机制具有重要意义,并为结核病临床早期诊断研究以及特效新药的研发奠定基础。材料及方法:通过NCBI的GEO Datasets数据库,筛选获得活动期肺结核患者体液(全血)基因表达谱数据构成原始数据集,运用R语言Limma包中线性模型-经验贝叶斯统计的方法结合传统t-检验对表达谱数据实施非特异性过滤,筛选出差异表达的基因。应用DAVID(Database for Annotation,Visualization and Integrated Discovery)和KEGG(Kyoto Encyclopedia of Genes and Genomes)分别对差异基因进行功能分析(GO-Analysis)与信号通路分析(Pathway-Analysis)。基于筛选出的差异基因集,整合TRED转录调控元件数据库,构建活动期肺结核免疫应答基因调控网络,并通过DAVID在线注释工具对网络基因进行疾病相关性分析。通过q PCR验证网络中重要的节点基因(SPI1、CEBPB、FCGR1A和ICAM1)的表达水平,并对SPI1、CEBPB、FCGR1A和ICAM1组成的基因集进行ROC曲线分析以确定其作为活动期肺结核诊断标志物的特异性与灵敏度。实验结果:本研究收集到4个基因表达谱原始数据集,包括40例活动期肺结核患者全血样本芯片数据与118例对照组健康人全血样本芯片数据,共筛选获得1539个差异表达的基因,其中1041个基因表达上调,498个基因表达下调;对差异基因进行功能分析,得到显著上调的条目68个与显著下调的条目22个(P<0.01),信号通路分析得到显著上调的条目18个与显著下调的条目7个(P<0.01);基于差异基因集并整合TRED转录调控元件数据库建立了包含52个差异基因的基因调控网络,其中包含6个转录因子(SPI1、CEBPB、STAT1、STAT3及STAT5A),SPI1、CEBPB调控了大部分靶基因;DAVID疾病关联分析显示网络中52个基因分别与免疫系统疾病(26个基因)、炎症性疾病(14个基因)、心血管疾病(15个基因)及癌症(15个基因)相关(P<0.01);网络中同时受到3个以上转录因子调控的基因为枢纽基因,包括FCGR1A和ICAM1、MUC1,q PCR验证枢纽基因FCGR1A、ICAM1及转录因子SPI1和CEBPB,得到SPI1、CEBPB、FCGR1A和ICAM1表达倍数分别为1.99±0.09(P<0.001)、2.57±0.32(P<0.01)、9.58±0.54(P<0.001)和1.86±0.15(P<0.01),表达水平与芯片数据分析结果趋势一致;ROC曲线分析SPI1、CEBPB、FCGR1A和ICAM1组成的基因集作为活动期肺结核诊断标志物的特异性较高、灵敏度较强,即AUC为0.9781。结论:1)构建了以SPI1和CEBPB为主要转录因子的基因调控网络,呈现宿主在活动期肺结核免疫应答过程中基因的表达状态及基因间的调控关系与作用;2)SPI1、CEBPB、FCGR1A和ICAM1组成血液诊断基因集,特异性较高、灵敏度较强,可作为活动期肺结核体液诊断候选标志物簇。