论文部分内容阅读
目的:分析2004-2014年全国肺结核疾病监测发病数据,反映和揭示全国肺结核病的基本流行特征(高危发病年龄人群、高危发病月份和重点发病地区)和发病趋势。通过对各地区发病率时间轨迹进行相似性聚类分析研究,分离出多个具有不同肺结核发病率时间轨迹特点的地区类别,为全国分类预防和合理规划肺结核疾病医疗卫生资源提供依据。除此之外,为了提前预知我国各地区的肺结核发病情况,一个新型的多地区相互协作的肺结核发病预测模型(MR-GCLSSVM)被提出,对比了新构建的多地区肺结核发病预测模型和两个单一地区发病模型在全国32个地区肺结核发病率数据集上的预测能力,并成功地预测了2015年32个地区的肺结核发病率。研究的结果能为我国各地区肺结核防治提供定量依据,也可为全国公共卫生事业的可持续发展制定切实有效的预防和治理策略提供参考。方法:基于中国疾病预防控制中心(CDC)法定报告传染病数据库的肺结核疫情数据,使用统计、群智能优化参数与神经网络结合的方法对肺结核疫情数据进行处理、分析和建模。本研究主要使用到的方法包括:描述性流行病学法、季节指数法、自组织特征映射聚类方法(SOM)和MR-GCLSSVM模型(多地区的灰狼算法和交叉验证结合优化参数的最小二乘支持向量机模型)。结论:1.总体趋势:全国肺结核病发病率在2005年达到最高峰值后,有明显下降的总体趋势。全国总体发病情况和防控状态均表现良好。2.年龄分布:高危和低危发病人群分别为70-74岁和0-4岁,有明显的年龄特征分布且为先低峰后高峰的双峰分布特点。3.月份分布:肺结核发病率以一年为周期,1-6月是肺结核的流行月份,高危月份为1月、3月和4月,低危月份为9-12月。有明显的月份分布且为自1月起至12月发病率持续下降的分布特点。4.地区分布:高危地区包含广西、海南、贵州、西藏和新疆等经济不发达和医疗水平相对较低的地区。发病低危地区为北京、天津、上海和山东等经济发达和医疗卫生水平较高的地区。肺结核病发病率的高低危地区分布和地区的经济发展和医疗卫生水平可能有一定的关系。5.聚类分析:全国各地区发病率时间轨迹的相似性聚类研究中得出了4个具有不同发病率时间轨迹的地区类。聚类结果表明:贵州和新疆地区被聚类为第1类,这两个地区的发病率轨迹平均值普遍高于其他3类,具有很强的相似性。第4类包含的地区(北京、天津、河北、辽宁、上海、江苏、山东、云南和宁夏)发病率时间轨迹也具有较高的相似性,且有发病率轨迹平均值普遍较低的特点。可以根据不同的地区类包含的特点采取分类策略防控肺结核。6.多地区发病预测:在多地区肺结核发病率预测上,本文提出了一个预测精准度高、预测误差小和建模方便的多地区协同的MR-GCLSSVM模型,为多地区疾病的向前预测提供了一个较先进的模型。