论文部分内容阅读
热带气旋是最具破坏性的自然灾害之一,每年都给人类带来巨大的灾难。既定的类别和模式可以用于热带气旋预报。根据1884-1974年的热带气旋路径资料以及以往经验,结合台风移动过程的环流特点,西太平洋的热带气旋路径可以分为七类。本文利用数据挖掘中的空间聚类理论对西北太平洋的热带气旋路径进行定量分类,有效地挖掘出潜在的信息和模式,验证和拓展了经验分类的结果,为热带气旋的预报提供有价值的参考信息。
本文首先利用多项式回归模型来模拟热带气旋路径,然后结合有限混合模型,建立热带气旋的空间聚类模型,在对热带气旋路径聚类的同时考虑曲线平移。然后利用EM算法进行模型迭代计算。
由于标准EM算法收敛速度十分缓慢,尤其当数据量较大的时候,所以本文首先考虑了使用Lazy EM算法以加速收敛。接下来,使用基于几何学的ψα2与r-ψαα算法来加速收敛。本文创造性地将Lazy EM算法与ψα2算法、r-ψαα算法结合起来使用,取得了非常突出的加速效果,结合之后的算法分别取名为Lazy-ψα2算法和Lazy-r-ψαα算法。在对六种算法进行综合比较之后,选择了Lazy-ψα2算法作为本文聚类分析的算法。在聚类之前,需要通过蒙特卡罗交叉检验选择类个数以及回归多项式的次数等参数,同时,本文对空间聚类模型进行敏感性分析以检验其稳健性以及对数据的敏感性。
本文在选择好算法与参数之后,对西北太平洋1949年至2006年间的所有热带气旋、登陆我国的热带气旋、影响上海的热带气旋以及历史上某季节的热带气旋的路径在Matlab平台上分别进行聚类分析,并且对每类热带气旋路径进行讨论和统计分析,尤其将西北太平洋历史热带气旋路径聚类分析的结果与以往相关研究进行详细的比较分析。最后,在Visual Studio 2005平台上利用MapObjects组件开发了对热带气旋路径进行归类以提供预测信息的工具。
最后对本文所做的工作进行总结,并且对未来的工作提出了展望,如可以利用KD树组织数据以获得更好的加速效果以及将该聚类算法推广到网络环境,结合“空间相似”进行热带气旋路径的空间聚类,进行在线空间聚类分析等等。