论文部分内容阅读
20世纪科学技术的飞速发展促进了地理学研究的飞跃。随着计算机技术的不断进步与地理信息系统的迅速发展,人们对空间数据信息处理的要求逐步提高。而地理信息系统技术是空间信息采集、管理、分析和表示的工具和技术,目前,地理信息系统技术已广泛应用于城市管理与规划、交通规划、生态环境管理与规划、市场分析、物流管理等诸多领域。
在空间数据分析与处理的过程中,因采样点分布不均、数据离散等原因无法获得研究区域的所有数据信息。由于空间信息在地理上具有依赖性,也就是说地理事物在空间上相距愈近,则相关性越大;反之,如果空间距离愈远,则其相关性越小。因此,经常采用空间插值的方法来获取非采样点或离散数据空间内的数据信息。
传统的空间插值方法包括几何方法、函数方法和统计方法等。其中,几何法和函数法无法对误差进行理论估计,难以满足插值精度;统计方法需要数据符合一定的空间分布规律。支持向量回归是基于结构风险最小化理论和以数据驱动为基本特征的机器学习方法,在逼近非线性函数时,SVR具有全局最优、良好的泛化能力等特性,但其性能与超参数的取值有密切关系。
本文在介绍支持向量机理论背景的基础上,针对支持向量回归的超参数优化问题,结合遗传算法的全局搜索能力和单纯形算法的局部搜索能力,提出遗传.单纯形混合优化算法和基于单纯形交叉算子的遗传算法用于支持向量回归参数优化。并在UCI十组机器学习基准数据集上对改进算法的性能进行了验证和对比。以其中两组数据automobile和forestfires观察均方根误差的变化情况,最后得出改进后的参数优化方法在收敛速度上较传统遗传算法有明显提高的结论。
另外论文在地质统计学变差函数的属性-变程的基础上,提出根据变程确定滑动邻域的方法,并由此提出基于滑动变程的SVR空间插值算法。并在SIC’97国际空间插值数据集上比较取不同数量邻域点时算法的预测性能。仿真实验结果表明,需选择合适的邻域点数目才能取得最优的插值效果。各项误差统计数据说明基于滑动邻域的SVR空间插值算法比传统SVR算法的预测性有显著提高。
基于支持向量回归的空间插值算法是一种结合机器学习的新的空间数据处理方法,引入了非线性和高维数据处理机制,通过本文的实验证明,该方法在精度上具有较好的性能,如能缩短训练时间,加快算法的求解速度,可具有很好的应用价值。