论文部分内容阅读
目的:对2008-2017年山西省11个地级市肺结核监测数据进行时空聚集特征研究,对可能影响肺结核的气象因素进行探讨,并利用气象因素建立基于动态贝叶斯网络(DBN)的早期预警模型,与静态贝叶斯(BN)、支持向量机模型(SVM)进行比较,评价三个模型的分类识别性能,最终为山西省肺结核防控决策提供科学合理的依据支持。方法:本研究利用2008-2017年山西省11个地级市肺结核监测数据及同期气象资料,对山西省肺结核进行流行病学特征描述;使用多指标面板数据的聚类分析方法探索结核病空间聚集性;利用移动百分位数法对肺结核病暴发的风险等级进行划分,从而研究其时间聚集特征;通过时间序列互相关分析确定气象因子对肺结核发病的滞后期;经贝叶斯结构学习和参数学习,最终建立动态贝叶斯网络预警模型。结果:1.2008-2017年山西省肺结核报告发病率总体呈下降趋势,每年均呈现中间高两头低的现象,具有一定的季节特征,1-2月报告发病数最低,3月份为全年的最高峰,春季和初夏有明显的季节性升高;十年平均报告发病率前五位地级市依次为大同市(69.38/10万)、忻州市(66.14/10万)、运城市(65.60/10万)、吕梁市(60.95/10万)、临汾市(60.31/10万),且都高于山西省肺结核发病率十年平均水平(55.67/10万);多指标面板数据的聚类分析结果将11个市分为两个区域,以便针对不同区域建模分析,第一区域包括太原、长治、晋城、晋中、吕梁,第二区域包括大同、朔州、运城、忻州、临汾。2.依据互相关分析结果,采用滞后2个月的气象因子进行动态贝叶斯模型拟合是比较合理的;月平均气温和月降水量与肺结核发病率呈正相关关系,月平均气压与肺结核发病率呈负相关关系,其余在各地区间没有明显的规律可循;经过主成分回归分析,结果显示月降水量等七个气象因素都是影响山西省肺结核发病的主要因素。3.三种模型的分类识别性能比较发现,两个区域中DBN模型的分类准确率都为最高,第一区域为95.00%,第二区域为97.50%,其余precision、TPR、TNR、F-Measure、G-measure等指标也都是DBN最高。其中,DBN的F-measure值最大、两区域分别为0.77和0.84,说明DBN反映少数类的性能好于其他两个模型;G-measure值最大,两区域分别为为0.86和0.85,说明其对于少数类和多数类的综合分类性能更好;两区域AUC由大到小依次为DBN>BN>支持向量机。结论:1.山西省肺结核在时间、空间以及时空上存在聚集现象,春季和初夏为发病高峰,3月为全年最高峰,十年平均报告发病率从高到低前五位地级市依次为大同市、忻州市、运城市、吕梁市、临汾市。月降水量等七个气象因素都是影响山西省肺结核发病的主要因素。2.对于具有空间和时间两个维度特征的面板数据,本研究所建立的肺结核-气象因子的动态贝叶斯网络预警模型的分类识别性能显著优于静态贝叶斯网络、支持向量机模型。DBN能将变量随时间变化的规律与经验积累下来,结合新得到的信息,更好地对未来时刻进行预测,本研究结果为山西省肺结核防控决策提供新的思路和方法。