论文部分内容阅读
肺炎克雷伯菌(Klebsiella pneumoniae)和肺炎链球菌(Streptococcus pneumoniae)分别属于革兰氏阴性菌和革兰氏阳性菌,是社区获得性肺炎的重要致病菌。由于它们主要存在于肠道、呼吸道和鼻咽等部位,也成为院内医疗相关感染的主要致病菌,严重威胁着人类健康。肺炎克雷伯菌和肺炎链球菌的检出率和耐药率逐年上升,它们对多种抗菌药物耐药性的演变已成为主要的临床和公共卫生问题。耐药基因是细菌产生耐药性的主要原因,耐药基因上存在一个或多个单核苷酸多态性(Single nucleotide polymorphism,SNP)位点,其中的非同义单核苷酸多态性(Non-synonymous SNP,NS-SNP)突变可以改变氨基酸序列,影响蛋白结构。NS-SNP在全基因组测序(Whole-genome sequencing,WGS)中具有高密度和丰富的遗传信息,遗传性质稳定,并且NS-SNP突变已广泛应用于多种疾病和微生物耐药领域的基因组研究中,但很少有研究通过NS-SNP突变介导蛋白质的构象和功能来分析微生物耐药特征和相关耐药机制。针对上述问题,本文基于WGS数据挖掘肺炎克雷伯菌和肺炎链球菌相关的耐药特征,包括耐药基因、NS-SNP和相关耐药蛋白,并通过蛋白质构象和功能进一步从基因组水平分析其耐药分子机制,具体研究内容和结果如下:1.对于肺炎克雷伯菌和肺炎链球菌耐药特征的挖掘,首先通过MUMmer 3软件进行全基因组序列比对,得到SNP数据集。其次,为了实现与耐药相关的SNP特征选择,本文自主设计了一种快速特征选择(Fast Feature Selection,FFS)的机器学习算法,该算法设置突变截止频率,将SNP按照突变频率的降序进行排列,SNP的突变频率越高,该位点及所在基因对遗传的影响越显著。最后自主设计的密码子突变检测(Codon Mutation Detection,CMD)机器学习算法被用来筛选NS-SNP突变,该算法基于密码子的变化,判断SNP突变前后是否改变其所在氨基酸序列。实验结果验证了FFS算法和CMD算法的有效性,并且它们完全由数据驱动,具有广泛的适用性。实验结果表明,在肺炎克雷伯菌10种抗生素的NS-SNPs突变特征数据集中一共存在63个重叠NS-SNPs,即在10种抗生素数据集中均发生突变的NS-SNPs,其中有42个NS-SNPs改变氨基酸性质,这些NS-SNPs位于39个耐药基因上。对于肺炎链球菌5种NS-SNPs突变特征数据集,一共有93个重叠NS-SNPs发生突变,其中有11个NS-SNPs导致氨基酸性质的变化,这11个NS-SNPs位于10个耐药基因上。根据NS-SNPs、耐药基因及其编码蛋白提供肺炎克雷伯菌和肺炎链球菌耐药特征,作为下一步计算/预测蛋白结构的基础数据。2.对于肺炎克雷伯菌和肺炎链球菌耐药机制的研究,首先基于氨基酸序列利用从头计算的方法对蛋白结构进行构建,并利用Verify 3D、Procheck、Whatcheck、Errat和Prove五个软件对模型质量进行评估。其次通过Swiss-model服务器来预测蛋白质同源模型,并利用Sequence Identity、GMQE和QMEANDis Co Global三个参数对模型质量进行评估。最后通过分子操作环境(Molecular Operating Environment,MOE)软件对蛋白结构进行叠加,利用均方根偏差(Root Mean Squared Deviation,RMSD)参数衡量两个蛋白结构的相似性,从而根据同源蛋白在细菌耐药过程中发挥的重要作用,分析NS-SNPs突变介导的细菌耐药性。在肺炎克雷伯菌的耐药机制分析中,结果表明NS-SNP(ID 3662328)位于KPHS_36430基因上,该NS-SNP突变将色氨酸变为精氨酸,识别到的同源蛋白为孔蛋白。孔蛋白与细菌耐药性相关的三种机制分别为孔蛋白丢失、孔蛋白通道大小的改变,以及孔蛋白表达水平的降低,NS-SNP(ID 3662328)通过介导孔蛋白的突变影响了细菌对抗生素的耐药性。在肺炎链球菌的耐药机制分析中,结果表明位于基因rps G上的NS-SNP(ID 247805)和位于基因suf B上的NS-SNP(ID 817989)分别将氨基酸由赖氨酸变为谷氨酸,酪氨酸变为组氨酸,识别的同源蛋白为Vgal蛋白和ABC转运蛋白,同属抗生素耐药性ABC蛋白(Antibiotic resistance ABC,ARE-ABC)。它们通过与核糖体相互作用将药物从其结合位点置换出来,导致了抗菌药物作用失效。ID为1101585的NS-SNP位于基因pdr M上,引起苏氨酸到精氨酸的变化,同源蛋白为Nor M耐药蛋白,Nor M耐药蛋白通过Na+和H+的逆向转运机制不断将药物释放:Na+与药物结合促进药物释放,H+与DNA诱导损伤蛋白结合促进药物分离,从而导致细菌的多药耐药性的产生。本研究为开展微生物耐药组学的研究提供了实践方法、耐药特征的数据支持,为临床上诊断细菌耐药性和针对细菌感染治疗的用药提供见解。