论文部分内容阅读
随着信息技术的迅猛发展,其相关技术已广泛应用于农业领域,而农业信息化是当前业界的研究热点。随着地理信息系统(GIS)和空间数据获取技术的发展,产生的空间数据量大、多维、难于管理和分析,然而许多有价值的信息就隐藏在这大量数据的背后。为了从这些数据中获得有价值的信息,就需要一种有效的数据分析手段来实现这个目标。针对上述问题,本文将对空间数据挖掘技术以及可视化技术进行农业数据的研究与应用。本文主要创新点及工作是:1.提出了组合加权距离的模糊C均值算法。在详细介绍模糊C均值算法的基础上,结合农业信息聚类的特点,针对不同属性的影响度或贡献度不一样的问题,扩展了常用的欧式距离相似度度量公式,提出了广义加权欧式距离,并对权重进行改进。提出了组合属性权重概念,将权重分为主观权重和客观权重其中客观权重使用主成分分析法,在计算时引入权重系数β,再通过加法合成法计算出权重,然后为目标函数构建拉格朗日函数,计算出了新的迭代更新公式,并设计算法的运行流程。通过与模糊C均值(FCM)算法和普通加权C均值(WFCM)算法的对比,验证了本文提出的方法效率更高,目标函数收敛速度更快。最后在农业实际应用中,对比分析了本文的模糊聚类算法的效果更符合实际情况。2.提出了聚类可视化模型。在聚类时为了使数据能更直观的显示,将数据映射到平行坐标中进行可视化,并对K-means算法进行分解在聚类过程中融入可视化技术,为中间结果设定保存机制,从而使中间结果能有效地可视化显示,通过采用平行坐标的交互技术对数据进行显示,使结果分析更加清晰,最后在Matlab中验证了聚类可视化挖掘能更有效的获取信息。3.为验证本文所提出方法的实效性,将其应用于农业经济类型划分、农业自然灾害分析评估和洪涝灾害预测三个方面。本文的模糊聚类对农业的经济类型有良好的划分效果,聚类的平行坐标可视化方法在农业自然灾害的评估和预测方面有一定的实际效用,能更有效的提取农业中有用信息,为农业信息化发展提供了一种思路。