论文部分内容阅读
随着“数字林业”发展,人们获取了大量的森林资源数据,如何从这海量的数据中提取出有用的信息用于指导林业经营管理成为人们关注的问题。数据仓库和数据挖掘技术能从这海量的数据中提取人们感兴趣的信息,用于指导林业的生产。 本文根据林业管理者的需求,从分析二类调查数据的特征入手,并从概念模型、逻辑模型、物理模型上设计了林业数据仓库。在概念模型设计中,主要进行需求分析并创建了信息包图;在逻辑模型中,运用OLAP知识设计多维的联机分析的模型并在粒度设计问题上,选择了双重粒度;在物理模型设计上本文采用并行的存储结构RAID(Reduandant Array of Inexpensive Disk,廉价冗余磁盘陈列)结构和位图索引(BitMap)方法来优化性能。 在数据挖掘模型中,运用了粗糙集理论设计了立地质量评价模型和用模糊神经网络方法实现了福建省杉木的蓄积量预测模型。在立地质量评价模型中主要运用属性的重要度来确定各评价因子的权重,运用总分值来确定各评价等级。在福建省杉木的蓄积量预测模型,由于BP神经网络在大样本的学习中,速度非常慢,为了解决该该问题,选用模糊聚类算法先对学习样本进行分类并从不同类别中选取部分学习样本作为新的学习样本。并运用三种BP算法(L-M优化算法、贝叶斯正则化算法、动量梯度下降算法)来设计该预测模型,并在matlab上实现。最后经过比较确定福建省杉木的蓄积量预测模型为贝叶斯正则化算法,中间隐含层的结点为15。 最后,提出了二类清查数据仓库的系统结构,并指出了本文需要进一步讨论和研究的内容。