论文部分内容阅读
随着全社会对于食品安全的重视程度不断提高,政府各级食品安全监管部门投入在食品安全监管上的人力、财力、物力在不断增加。投入在食品安全检测方面的经费也在不断增加,每年都能产生大量的食品安全检验数据。数据在逐年积累,但是对于数据的利用多数情况下为统计分析,深层次的挖掘应用较少。因此如何对逐年积累的食品安全检测数据进行进一步的分析、挖掘利用,成为一项值得研究的课题。作为一种从数据中发现隐藏在数据中的规律和知识的数据挖掘技术,已经被广泛应用在了许多领域中,并取得了较好的效果,出现了很多成功应用的案例。如果将数据挖掘技术应用在食品安全检测数据中,可以帮助监管部门有效利用这些检测数据,从而得到更有价值的信息,更好地指导食品安全监管工作。本文研究数据挖掘技术食品安全数据中的应用,所做的工作主要有以下几个方面:首先介绍了食品安全相关知识、数据挖掘的相关知识,数据挖掘的行业应用情况。收集了山东省食药局官方网站公布的2015-2019年的抽检不合格食品安全数据,并对收集的数据进行清理、集成、归约、转化等一系列的预处理,以得到适合于进行数据挖掘的食品安全数据集。随后将预处理后的食品安全数据集进行了关联规则挖掘分析,得到了一些有意义的关联规则,并将挖掘得到的关联规则进行了专业的解读。接着进行了食品安全数据的分类研究,使用分类算法对经过预处理的食品安全数据集进行建模,建立了不合格指标的分类预测模型,并利用后续公布的97条抽检不合格食品安全数据对建立的模型进行验证,分类准确率为与分类模型的准确率接近一致,并对所建立的分类模型所导出的分类规则进行了专业解读。这些数据挖掘结果、数据挖掘模型的有效利用能够为食品安全监管提供决策依据,对今后的食品安全监管工作有着重要的参考价值。