论文部分内容阅读
小麦是我国三大重要粮食作物之一。在小麦的生产过程中,光照、温度、土壤、水分等各种环境因素都会对其生长产生影响。如何实现对小麦生长环境数据的快速采集,如何对小麦生长环境中出现的异常情况进行自动检测,已经成为了确保小麦安全稳定生产的重要问题。物联网的发展为改变传统的作物生长环境数据采集方式提供了契机。借助物联网中的无线传感器网络等技术可以实现小麦生长环境数据的快速采集、即时传输和动态显示。随着基于物联网的小麦生长环境数据采集应用的实施,积累了大量与小麦生长过程息息相关的环境数据。这些海量数据虽然真实地记录了小麦生长环境的状况,但是也为使用者从中发现异常情况等有用信息带来了巨大的困难。数据挖掘是从大量的、有噪声的数据中挖掘出潜在的有用信息或知识的过程,正是解决这一问题的有效技术。因此,针对小麦生长环境监测中数据实时采集和异常检测的应用需求,本文基于物联网技术和数据挖掘技术,对小麦生长环境监测中的数据采集和数据异常挖掘这两个关键的课题进行了研究和探索。主要的工作如下:(1)针对小麦生长环境数据采集所存在的成本高和实效差等实际问题,采用ZigBee技术实现了基于物联网的小麦生长环境数据采集系统。系统采用基于ZigBee标准的无线传感器网络对空气温度、空气湿度、土壤温度、土壤湿度、风速、风向、降雨量、光辐射等各项小麦生长环境数据进行大范围的采集;利用部署在网络主节点上的基于ARM和Linux的嵌入式系统对采集的数据进行打包及AD转换,重点实现断点续传功能,并通过3G路由器发送到Web服务器;使用位于Web服务器上的信息管理系统对数据进行接收,同时实现了对数据进行查询和下载等功能。系统的设计和实现充分考虑了小麦生长环境数据采集的实际情况,具有良好的应用效果。(2)针对小麦生长环境数据异常挖掘的复杂应用背景和制约因素,提出了一种基于粗糙集和决策树集成的混合分类算法。混合算法将粗糙集作为一个预处理器在不损失有用信息的前提下有效地减少冗余属性,然后使用自助法重采样技术生成一组决策树来构建集成分类器,从而提高对小麦生长环境数据进行异常挖掘的精度。为了验证算法的有效性,在小麦生长环境数据上对不同的分类方法进行了实验评价。实验结果表明所提出的混合算法取得了有效的性能改进。(3)针对数据挖掘中传统的聚类技术无法满足小麦生长环境数据异常挖掘需求的问题,提出了一种基于COD和STORM的聚类集成算法,用于小麦生长环境中海量且动态更新的数据流类型数据的异常检测,实现对小麦生长过程调控的异常预警。基于所提出的聚类集成算法设计和开发了一个小麦生长环境异常检测的原型系统,最后通过实验验证了所提出的聚类集成算法的有效性。主要的创新点如下:(1)基于物联网技术设计了小麦生长环境数据采集系统,取得了良好的使用效果。(2)提出了一种基于粗糙集和决策树集成的混合分类算法,实验结果表明所提出的算法取得了有效的性能改进。(3)提出了一种基于COD和STORM的聚类集成算法,设计并实现了一个小麦生长环境异常检测的原型系统,通过实验验证了它们的实际应用价值。