函数型聚类分析方法及其应用研究

来源 :浙江工商大学 | 被引量 : 1次 | 上传用户:zzyu888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是多元统计分析的一个分支,也是数据挖掘中十分常用的一种分析方法。在传统的聚类分析中,无论分析的数据是横截面数据、时间序列数据还是面板数据,聚类分析的对象通常是采集的离散数据点,相对应的数据处理方式以向量的形式呈现。伴随着信息技术的高速发展,尤其是传感器的普及以及存储技术的飞跃发展,许多领域的数据都呈现出海量性、连续性的特点,数据之中包含着许多动态的信息,这一类数据通常被视作函数型数据。针对函数型数据,传统的聚类分析在聚类的过程中难以衡量数据的动态变化特征,因此提出了函数型聚类分析。相比传统的聚类分析,它将数据看作是一个整体,从函数的视角出发,在聚类的过程中挖掘了数据更多的动态信息。对于具有函数特性的数据,函数型聚类分析方法能够达到更好的聚类效果。基于函数型聚类分析方法的优点,越来越多的学者开始使用函数型聚类分析方法,并对其进行深入的研究与拓展。本文通过对现有函数型聚类分析方法以及传统聚类分析方法的梳理和研究,发现目前函数型聚类分析方法研究的主要方向是基于函数型数据相似性度量的研究,并指出目前函数型聚类分析方法研究中存在的主要问题—基于数值距离或曲线形态的单一角度来衡量函数型数据相似性的问题。为了解决这种单一性问题,本文提出了一种同时兼顾函数型数据的数值距离与曲线形态的相似性度量方法—基于极值点偏移补偿的相似性度量,并将其与现有几种函数型数据的相似性度量方法进行了对比,通过可视化展现更加清晰的区别了各种方法的特点。为了更加满足实际需求,本文尝试将单指标函数型聚类分析方法拓展至多指标函数型聚类分析方法(函数型熵权法)。为了验证方法的有效性,本文分别使用传统的聚类分析方法、基于数值距离的函数型聚类分析方法、基于曲线形态的函数型聚类分析方法以及本文提出的兼顾数值距离与曲线形态的函数型聚类分析方法对上证50样本股的进行聚类,并使用轮廓系数对各方法的聚类结果进行比较,得出如下结论:无论单指标函数型聚类分析方法还是多指标函数型聚类分析方法,聚类分析的效果都优于传统的聚类分析方法;进一步,本文提出的基于极值点偏移补偿的相似性度量,确实达到了同时测度函数型数据的数值距离与曲线形态的效果,使用这种相似性度量进行函数型聚类分析,聚类分析的效果也得到了提升!
其他文献
文学研究会对儿童文学的提倡及旗下刊物《儿童世界》的诞生,是叶圣陶及其原创童话出现的关键,童话集《稻草人》的出版,进一步宣告了"五四"以来作为独立分支形态的儿童文学的
银纳米线透明导电薄膜具有良好的电导性、热导性、光学透明性和柔韧性,在柔性电子器件领域中具有光明的发展前景。然而银纳米线透明导电薄膜在市场上的普遍应用受到了限制,主要是因为银纳米线透明导电薄膜在紫外光辐照条件下的长期稳定性较差:首先,紫外光辐照容易使银纳米线产生表面等离子激元共振,从而诱导银原子的迁移,导致银纳米粒子在纳米线表面成核并长大,进一步造成银纳米线直径的改变;其次,紫外光辐照还会加速银纳米
随着信息技术的发展,会计电算化在我国已经得到了普及,会计电算化在会计工作中不仅产生了无可估量的重大作用,而且还提高了会计工作的效率和质量,促进了会计工作的规范化,转
以学术视角剖析《园冶》,从构图总格、择址立意、造景之法、哲学取向等四个主要方面阐释《园冶》中所折射出的我国古典园林设计的基本理念。
摘要:“概括启蒙运动对人文主义思想的发展”是《历史课程标准》中的一句话,教学实践中,笔者是从启蒙运动的“自由”“人权”“理性”“平等”“民主”“法治”几个方面呈现其对
报纸
随着我国经济的快速发展,物流行业业务需求增长迅速,但我国物流行业起步晚、规模小、集中度低的现状,已成为制约物流发展的瓶颈,因此必须加快物流业的标准化体系和信息系统的建设