神经网络模型和样条模型在职业锰暴露危害评估中的应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:xiaomei52689
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:   广西锰矿产资源丰富,是职业性锰中毒高危人群集中的地区。随着国家西部开发的推进,职业性锰暴露的人数不断增加,其职业危害问题越来越受到重视。因此,研究职业性锰暴露的危险性以及锰暴露工人的职业保护是当前备受关注的问题。   在回顾性职业暴露评价中,通常用空气锰尘的历史记录来计算暴露量,缺点是数据不完整,而且历史记录往往不能充分体现过去暴露的特征。对缺失数据的估计方法可定性或者定量,但定量的方法无法精确计算累积暴露水平。而且用于职业锰暴露危害评估的传统统计方法没有考虑多个自变量之间的相互关系,无法使数据信息得到充分利用,应用不当还会得出错误结论;另一方面,在广西多年的锰尘防治研究中,尚未进行过大型的职业流行病学调查以及系统全面的评价。针对上述存在的问题,有必要进行职业流行病调查以便了解锰暴露的概况,并探讨适用于职业锰暴露危害评估的更合理的统计方法。   人工神经网络(artificial neural network,ANN)是适用范围广泛的非线性模型。ANN的研究主要在模型重建、预测和数字通讯等工科领域,国内医学方面在疾病诊断、肿瘤预后和药学等方面有一些应用,但远不如国外研究成熟。样条函数具有很强的适应数据和函数变化能力,目前在医学的应用较少,主要是在Cox模型危险度评价的拟合、影像学图形处理等方面。这些先进的统计模型具有强大的应用潜力,应该推广到职业流行病领域。   目的和意义:   本研究在大规模流行病学调查的基础上,描述广西职业性锰暴露的概况。采用合理的非线性模型推算锰尘缺失值;并建立适宜的非参数模型,计算连续性暴露因素的优势比(odds ratio,OR);最后分析职业性锰暴露人群职业因素的剂量一反应关系。   采用的先进统计方法给职业流行病学的研究提供新的思路,所得出的分析结果和具体建议,为慢性职业性锰中毒的一级预防提供科学依据。   材料与方法:   环境资料来自锰矿生产、加工行业的工作场所三十年锰尘监测数据,用于估计锰尘浓度水平和评价锰尘分布规律。   统计方法包括:   1.引入BP-ANN推算历年的锰尘浓度,并与多重线性回归的结果做比较,评价它们的误差和拟合优度,确定较优模型。ANN在锰暴露研究领域属首次使用,旨在解决锰尘资料不完整和变量关系复杂问题。并构建锰尘的职业暴露模型,估算高危人群的累积暴露指数;   2.应用样条函数估计累积暴露指数的OR值,比较多重logistic回归、多重分段logistic回归和样条模型的拟合效果;用bootstrap再抽样方法评价三个模型的拟合效果的准确性和稳定性,确定最适宜的统计模型。本方法在国内职业流行病领域首次应用,旨在探讨解决锰职业因素的非线性问题和连续性变量危险度的估计。   采用病例对照研究,选择锰矿生产基层职工作为研究对象,估计累积暴露指数、工龄、工作环境、暴露距离、接触时间比例等诸多职业因素的危险度,分析锰暴露与健康危害的剂量-反应关系。   结果:   1.统计方法比较:   1.1 ANN预测模型推算锰尘浓度的准确度较高。与多重线性回归相比,ANN的误差参数的平均绝对误差和误差均方较小;拟合优度参数较小:赤池信息准则(157.576/160.045),施瓦兹信息准则(159.793/167.667),库尔贝克-莱布勒准则(0.496/0.508);配对秩和检验比较结果显示ANN的推测值和锰尘实际值具有相同分布(z=-0.402,P=0.687)。说明ANN模型比多重线性回归准确和稳定。   1.2多重样条模型估计的危险度比较准确,其拟合优度参数比传统logistic回归、分段logistic回归的数值减少:赤池信息准则(1898.147/2233.685/2282.783),施瓦兹信息准则(1988.717/2256.328/2205.425),-2倍的对数似然函数值(1866.147/2225.685/2274.783):bootstrap再抽样结果显示多重样条模型的拟合参数最小;而且Hosmer and Lemeshow拟合优度检验统计量最小,说明模型准确、稳定。以上表明样条模型具有超越传统方法的优越性,适宜用在锰暴露人群的危险度研究。   2.流行病学结果:   2.1广西锰矿区的锰尘浓度逐年减小,选矿和锰粉生产的工艺流程容易接触较多的锰尘。三十年生产场所的锰尘平均浓度是0.45 mg/m3:平均累积暴露指数是20.08mg/m3×年。   2.2体内锰蓄积到一定程度后,患病的危险度呈迅猛上升趋势。体内累积暴露指数约在13.45-58.31mg/m3×年之间时,OR值在1.00-2.00之间波动;当指数达到67.95mg/m3×年,暴露工人患病的危险度是非暴露工人的3.00倍,当累积暴露指数为84.50 mg/m3×年时,OR达过了10.00倍。工作环境的OR值是1.54,暴露距离与患病有较弱的负相关关系,工龄和接触时间比例对健康损害无直接关系。   结论:   本研究在国内首次尝试将人工神经网络和多重样条模型应用在职业流行病学研究中,结果显示这两种方法都优于相应的传统方法。利用神经网络推算的锰尘值较为准确,且由此求出了可靠的累积暴露指数。多重样条模型能估计出暴露人群的连续性影响因素精确的危险度,在职业锰暴露危害评估中具有更大的灵活性和适用性。   通过病例对照研究结合先进合理的统计方法,如实地分析了职业因素的危险度。特别是准确刻画了剂量-反应曲线的形状,并描述累积暴露指数的OR曲线的平台期和拐点值,对于高危人群的防护措施、慢性锰中毒的一级预防具有极其重要的意义。
其他文献
背景:乙醇俗称酒精,在肝脏中的主要代谢过程包括三个步骤:首先乙醇被乙醇脱氢酶(ADH)氧化为乙醛,然后乙醛被乙醛脱氢酶(ALDH)氧化为乙酸,最后乙酸分解为二氧化碳和水等物质。乙醇在肝
目的:通过对2000年和2005年湖南省7~18岁青少年身体发育水平及常见病状况进行描述、分析,探讨湖南省青少年身体发育规律及可能存在的问题,为湖南省青少年的培养和健康教育提供依据。方法:本次课题利用2000年与2005年全国学生体质与健康调研项目中的有关数据、资料和方法,以湖南省7~18岁青少年作为研究对象,选入14588人,以SPSS13.0建立数据库,进行描述性统计分析、两独立样本t检验、卡