函数型数据的分步系统聚类算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhqimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多研究和应用领域,数据呈现海量性、连续性等特点。在这种条件下,传统的数据处理方法已经难以满足现今社会数据分析的需要。函数型数据的产生为现代数据分析提供了新的思路,一方面能够有效降低海量数据的存储空间,并且可以借助函数方法对数据进行有效分析。但是函数型数据的研究发展时间较短,各种方法还不是很完善。本文就函数型数据的聚类分析,提出分步系统聚类算法,并对其应用做深入研究。论文首先阐述了函数型数据分析步骤以及常用的聚类方法。函数型数据聚类方法大多从数据的实际距离出发进行聚类,没有体现函数型数据的特点,不能充分利用数据信息。论文针对该问题提出了分步系统聚类算法,给出了函数型数据距离、均值的定义,详细阐述了分步系统聚类算法的具体步骤:首先,利用函数型数据间的实际距离进行聚类,然后,利用函数型数据的导函数距离对结果进一步聚类。为了检验方法的有效性,论文进行随机模拟,并用CR指数将其和传统方法进行了比较。最后,论文将函数型数据的聚类算法应用到实证研究,对世界国家通过人均GDP进行了划分,将结果同真实划分进行对比。根据函数型数据的特点,论文结合聚类分析,提出了函数型数据预测的可行方法,并验证该方法的可行性。随机模拟和实证研究表明,分步系统聚类算法能够在充分利用数据信息的条件下,对数据进行有效划分,在实际应用也体现出良好的应用价值。
其他文献
复杂海量数据往往表现为多种结构特征的混合体 ,回归类混合模型就是对这种混合体的一个描述 .该文基于统计学的有限混合分布理论和可识别性的相关结果 ,针对回归变量的三种情
采用MCT耦合器,基于大气模型WRF、海洋模型FVCOM和第三代海浪模型SWAN,建立了大气-海洋-海浪耦合模型,并将模型应用于台风"威马逊"过程的数值模拟。结果表明,选择合理WRF参数,
人工岛的建设必须对人工岛建设过程中以及人工岛建成后对周围水环境空间海洋物理、海洋生态的影响进行充分的评估与分析。本研究依托天津港东疆第二人工港岛工程,采用数学模
函数型数据的主成分分析(FPCA)已经成功应用在许多领域,但它主要研究的是单样本问题。本文详细讨论了一种新近发展的函数型数据分析的理论——函数型共同主成分(CFPC)分析方