论文部分内容阅读
目的:
牙周炎是比较典型的由于口腔微生物失调引起的疾病。牙周炎不仅可引起口腔病变还可以引起其他系统如心血管,免疫以及神经系统的病变。其主要致病菌不明确以及服用抗生素引起的抗药性加重了牙周炎治疗的困难。
本课题的目的主要是:1.通过比较牙周炎患者与对照组之间的口腔宏基因组组成上的差异研究新的牙周炎相关菌群;2.研究牙周炎患者口腔微生物功能上的差异;3.研究牙周炎患者口腔宏基因组中表达量显著上调的耐药基因及毒力因子基因;4.研究经历正选择的耐药基因以及毒力因子基因。
方法:
1.采集牙周炎患者与对照组口腔牙菌斑样品以及已发表文章中数据的下载。我们采取了30个牙周炎患者以及30个非牙周炎健康志愿者(其中有15个不合格)的口腔牙菌斑样本。由于每个样本提取DNA的含量不足,我们将每5个样本汇成一个样本以获取足够DNA量。最终我们得到3个对照样品(C1,C2,C3)和6个牙周炎患者样品(P1,P2,P3,P4,P5,P6);
2.样品提取处理以及WGS测序;
3.序列低质量过滤以及双端测序序列合并。首先,采用FastQC进行质控然后使用Trimmomatic v0.38去接头以及去除低质量序列;第二,使用Bowtie2将过滤后的高质量双端reads与人类基因组(hg19)进行比对,然后只取未比对的序列来去人组织DNA污染;最后,使用FLASH v1.2.11将非人组织双端序列合并在一起,重叠碱基数范围设定为6~40bp,错配阈值设为0.15;
4.物种归类,非冗余参考基因集的构建及功能注释。首先,使用MetaPhlAn2进行物种分类,并利用Wilcoxon Manny U秩和检验与Lefse线性判别分析分别进行显著性的计算来对疾病相关或者健康相关物种进行识别。用EggNog-Mapper v1.0.3将预测的非冗余基因的蛋白序列映射到其注释数据库,如KEGG、EggNog、GO等数据库来进行功能注释,并通过计算得到差异显著的功能通路。GSEA分析采用GSEA3.0软件,应用病人以及对照组内所有基因RPK值,以及两组中注释到某KEGG通路以及GO通路内基因的RPK值来对注释到的功能进行GSEA富集分析;
5.ARG与毒力基因注释。使用DeepARG对我们的数据和王的数据中每个样本中的所有序列进行耐药基因注释,根据ARGs-OAP的建议,将参数设置为相似度60%,Evalue设置为1e-7。各ARG的相对丰度计算如Hu的报道所述,用Lefse线性判别分析获得标记ARG基因。毒力因子的注释类似耐药基因,通过比对到毒力因子参考序列后计算得到各毒力因子的丰度信息后经Lefse分析得到标记毒力因子基因;
6.参考ARG和毒力基因蛋白序列的构建、SNP的检测及正选择基因的检测。使用Samtools v1.9和Bcftools v1.9以及Varscan v2.4.3检测SNPs。用VCFtools v0.1.16对低质量SNPs进行硬筛选,参数设置d=10,a=4,Q=15,Q=10。将两种软件找到的SNP合并后进行突变频率的计算和比较。耐压基因与毒力蛋白基因Ka/Ks率用KaKs_Calculator计算得到。
结果:
1.在门层级上,发现2个菌门(Synergistetes,Spirochaetes),以及在种层级上11个菌种(Treponemadenticola,Treponemamedium,Desulfobulbussporaltaxon041,Fretibacteriumfastidiosum,Bacteroidetesbacterium oraltaxon272,Atopobium parvulum,Treponema maltophilum,Tannerella forsythia,Anaeroglobus geminatus,Prevotella baroniae,Eubacteriumsaphenum)在病人中显著上调(单尾秩和检验,p<0.05);同时发现5个菌种(Actinomyces naeslundii,Corynebacteriummatruchotii,Campylobactercurvus,Porphyromonassp oral taxon279,Leptotrichiahofstadii)在对照组中显著上调(单尾秩和检验,p<0.05)。其中Atopobium parvulum之前并未被报道与牙周炎相关,但报道与口臭有关及牙齿病变有关;
2.种层面病人中Shannon.wiener index和Pielou index显著高于对照组(秩和检验,p<0.05);
3.转座酶,MATE转运体,细胞壁/膜/包裹合成,外来物质分解代谢,细菌侵袭,ATP依赖Lon蛋白酶,以及细菌毒素,以及鞭毛蛋白等功能注释在病人组中显著上调;
4.分别在我们的数据和王的数据中找到37个和67个在病人中显著高丰度的耐药基因,其中有两个一致显著高丰度的耐药基因,一个为Sav1866来自Staphylococcus aureus subsp.aureus COL,以及LlmA来自Paenibacillus。另外分别找到10个和70个在病人中高丰度的毒力因子。发现两个一致在病人中高丰度的毒力因子,一个为WecB,来自Listeria monocytogenes EGD-e,另一个是UgpE来自Streptococcus pneumoniae TIGR4;
5.耐药基因以及毒力因子基因突变分析发现耐药基因以及毒力因子非同义突变以及各组间独有的非同义突变一方面在我们病人中的最小等位基因频率要显著高于对照组,同时在王的数据中病人的最小等位基因频率也同样高于对照组,与文献报道耐药基因经历正选择的发现类似,同时推测毒力因子也可能经历正选择;耐药基因MacB(Yersinia enterocolitica,Faecalibacterium sp.,beta proteobacteriumAAP51),mexD和cpxr(Pseudomonas aeruginosa),以及pgpB(Porphyromonas gingivalis),以及毒力因子SP_0492(Streptococcus pneumoniae TIGR4),DivIB(Streptococcus pneumoniae TIGR4),rfbp(Haemophilus influenzae Rd KW20)只在病人中经历正选择同时只在对照组中经历负选择。
结论:
通过宏基因组测序,我们发现牙周炎患者与牙周健康人在口腔宏基因组组成和功能通路上的差异。发现了在牙周炎患者中显著上调以及经历正选择的耐药基因以及毒力因子基因。值得注意的是这些基因大部分都来自呼吸道感染病原菌,综合文献报道以及牙周炎患者中出现的呼吸道相关菌耐药基因和毒力因子表明,牙周炎与呼吸道感染有潜在的相关性,牙周炎患者有潜在呼吸道感染风险。
牙周炎是比较典型的由于口腔微生物失调引起的疾病。牙周炎不仅可引起口腔病变还可以引起其他系统如心血管,免疫以及神经系统的病变。其主要致病菌不明确以及服用抗生素引起的抗药性加重了牙周炎治疗的困难。
本课题的目的主要是:1.通过比较牙周炎患者与对照组之间的口腔宏基因组组成上的差异研究新的牙周炎相关菌群;2.研究牙周炎患者口腔微生物功能上的差异;3.研究牙周炎患者口腔宏基因组中表达量显著上调的耐药基因及毒力因子基因;4.研究经历正选择的耐药基因以及毒力因子基因。
方法:
1.采集牙周炎患者与对照组口腔牙菌斑样品以及已发表文章中数据的下载。我们采取了30个牙周炎患者以及30个非牙周炎健康志愿者(其中有15个不合格)的口腔牙菌斑样本。由于每个样本提取DNA的含量不足,我们将每5个样本汇成一个样本以获取足够DNA量。最终我们得到3个对照样品(C1,C2,C3)和6个牙周炎患者样品(P1,P2,P3,P4,P5,P6);
2.样品提取处理以及WGS测序;
3.序列低质量过滤以及双端测序序列合并。首先,采用FastQC进行质控然后使用Trimmomatic v0.38去接头以及去除低质量序列;第二,使用Bowtie2将过滤后的高质量双端reads与人类基因组(hg19)进行比对,然后只取未比对的序列来去人组织DNA污染;最后,使用FLASH v1.2.11将非人组织双端序列合并在一起,重叠碱基数范围设定为6~40bp,错配阈值设为0.15;
4.物种归类,非冗余参考基因集的构建及功能注释。首先,使用MetaPhlAn2进行物种分类,并利用Wilcoxon Manny U秩和检验与Lefse线性判别分析分别进行显著性的计算来对疾病相关或者健康相关物种进行识别。用EggNog-Mapper v1.0.3将预测的非冗余基因的蛋白序列映射到其注释数据库,如KEGG、EggNog、GO等数据库来进行功能注释,并通过计算得到差异显著的功能通路。GSEA分析采用GSEA3.0软件,应用病人以及对照组内所有基因RPK值,以及两组中注释到某KEGG通路以及GO通路内基因的RPK值来对注释到的功能进行GSEA富集分析;
5.ARG与毒力基因注释。使用DeepARG对我们的数据和王的数据中每个样本中的所有序列进行耐药基因注释,根据ARGs-OAP的建议,将参数设置为相似度60%,Evalue设置为1e-7。各ARG的相对丰度计算如Hu的报道所述,用Lefse线性判别分析获得标记ARG基因。毒力因子的注释类似耐药基因,通过比对到毒力因子参考序列后计算得到各毒力因子的丰度信息后经Lefse分析得到标记毒力因子基因;
6.参考ARG和毒力基因蛋白序列的构建、SNP的检测及正选择基因的检测。使用Samtools v1.9和Bcftools v1.9以及Varscan v2.4.3检测SNPs。用VCFtools v0.1.16对低质量SNPs进行硬筛选,参数设置d=10,a=4,Q=15,Q=10。将两种软件找到的SNP合并后进行突变频率的计算和比较。耐压基因与毒力蛋白基因Ka/Ks率用KaKs_Calculator计算得到。
结果:
1.在门层级上,发现2个菌门(Synergistetes,Spirochaetes),以及在种层级上11个菌种(Treponemadenticola,Treponemamedium,Desulfobulbussporaltaxon041,Fretibacteriumfastidiosum,Bacteroidetesbacterium oraltaxon272,Atopobium parvulum,Treponema maltophilum,Tannerella forsythia,Anaeroglobus geminatus,Prevotella baroniae,Eubacteriumsaphenum)在病人中显著上调(单尾秩和检验,p<0.05);同时发现5个菌种(Actinomyces naeslundii,Corynebacteriummatruchotii,Campylobactercurvus,Porphyromonassp oral taxon279,Leptotrichiahofstadii)在对照组中显著上调(单尾秩和检验,p<0.05)。其中Atopobium parvulum之前并未被报道与牙周炎相关,但报道与口臭有关及牙齿病变有关;
2.种层面病人中Shannon.wiener index和Pielou index显著高于对照组(秩和检验,p<0.05);
3.转座酶,MATE转运体,细胞壁/膜/包裹合成,外来物质分解代谢,细菌侵袭,ATP依赖Lon蛋白酶,以及细菌毒素,以及鞭毛蛋白等功能注释在病人组中显著上调;
4.分别在我们的数据和王的数据中找到37个和67个在病人中显著高丰度的耐药基因,其中有两个一致显著高丰度的耐药基因,一个为Sav1866来自Staphylococcus aureus subsp.aureus COL,以及LlmA来自Paenibacillus。另外分别找到10个和70个在病人中高丰度的毒力因子。发现两个一致在病人中高丰度的毒力因子,一个为WecB,来自Listeria monocytogenes EGD-e,另一个是UgpE来自Streptococcus pneumoniae TIGR4;
5.耐药基因以及毒力因子基因突变分析发现耐药基因以及毒力因子非同义突变以及各组间独有的非同义突变一方面在我们病人中的最小等位基因频率要显著高于对照组,同时在王的数据中病人的最小等位基因频率也同样高于对照组,与文献报道耐药基因经历正选择的发现类似,同时推测毒力因子也可能经历正选择;耐药基因MacB(Yersinia enterocolitica,Faecalibacterium sp.,beta proteobacteriumAAP51),mexD和cpxr(Pseudomonas aeruginosa),以及pgpB(Porphyromonas gingivalis),以及毒力因子SP_0492(Streptococcus pneumoniae TIGR4),DivIB(Streptococcus pneumoniae TIGR4),rfbp(Haemophilus influenzae Rd KW20)只在病人中经历正选择同时只在对照组中经历负选择。
结论:
通过宏基因组测序,我们发现牙周炎患者与牙周健康人在口腔宏基因组组成和功能通路上的差异。发现了在牙周炎患者中显著上调以及经历正选择的耐药基因以及毒力因子基因。值得注意的是这些基因大部分都来自呼吸道感染病原菌,综合文献报道以及牙周炎患者中出现的呼吸道相关菌耐药基因和毒力因子表明,牙周炎与呼吸道感染有潜在的相关性,牙周炎患者有潜在呼吸道感染风险。