论文部分内容阅读
在许多研究和应用领域,数据呈现海量性、连续性等特点。在这种条件下,传统的数据处理方法已经难以满足现今社会数据分析的需要。函数型数据的产生为现代数据分析提供了新的思路,一方面能够有效降低海量数据的存储空间,并且可以借助函数方法对数据进行有效分析。但是函数型数据的研究发展时间较短,各种方法还不是很完善。本文就函数型数据的聚类分析,提出分步系统聚类算法,并对其应用做深入研究。论文首先阐述了函数型数据分析步骤以及常用的聚类方法。函数型数据聚类方法大多从数据的实际距离出发进行聚类,没有体现函数型数据的特点,不能充分利用数据信息。论文针对该问题提出了分步系统聚类算法,给出了函数型数据距离、均值的定义,详细阐述了分步系统聚类算法的具体步骤:首先,利用函数型数据间的实际距离进行聚类,然后,利用函数型数据的导函数距离对结果进一步聚类。为了检验方法的有效性,论文进行随机模拟,并用CR指数将其和传统方法进行了比较。最后,论文将函数型数据的聚类算法应用到实证研究,对世界国家通过人均GDP进行了划分,将结果同真实划分进行对比。根据函数型数据的特点,论文结合聚类分析,提出了函数型数据预测的可行方法,并验证该方法的可行性。随机模拟和实证研究表明,分步系统聚类算法能够在充分利用数据信息的条件下,对数据进行有效划分,在实际应用也体现出良好的应用价值。