一种基于模糊聚类的有效性指标研究及应用

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:savages8850
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界数据量的剧增使得学者们针对数据处理做了许多研究,数据挖掘技术应运而生,聚类算法是数据挖掘技术的一种。聚类算法的目标是将一组没有先验知识的数据进行分类,这对于现实世界的数据处理非常有意义,因此许多学者在聚类算法领域做研究。模糊C均值聚类算法是聚类算法中应用最广泛的算法,该算法通过定义隶属矩阵解决了硬聚类算法中数据“非此即彼”特点的不现实性。由于模糊C均值聚类算法需要提前设置分类个数,这对于处理一个没有先验知识的数据集几乎是不可能实现的,因此有学者提出了有效性指标的概念。本文针对模糊聚类算法的有效性指标做了研究和改进,提出一种新的有效性指标函数,通过该有效性指标结合模糊C均值聚类算法即可有效的判定待处理数据集的分类个数。在实际应用方面,本文对图像处理中的色彩量化进行研究,引入这种基于模糊聚类的有效性指标从而解决了色彩量化算法中需要提前设定色彩数量的缺陷,并通过实验证明了该方法的有效性。本论文的主要成果和创新点如下:首先,针对传统距离计算方法的缺点,引入样本相似度度量方法。由于有效性指标考察了隶属矩阵、数据点之间的距离和数据点与聚类中心点之间的距离关系,因此本文引入新的样本相似度度量方法从而更加全面的考察点之间的距离关系,并将其与传统的距离计算方法对比证明了该方法的优越性。其次,通过样本相似性度量方法,改进了紧凑性指标和分离性指标。结合特征权重度量方法、新的紧凑性指标和分离性指标,设计了新的有效性指标,并应用于人工数据集和真实数据集从而验证该指标的合理性。最后,在实际应用中,将新的有效性指标应用于图像处理中的色彩量化。通过对彩色图片处理,判断待处理图片中的色彩情况,并将其分类进而得到最合适的色彩个数,生成新的调色板重绘图像。本文将该有效性指标应用于生物界的花朵和蝴蝶图片中,通过实验验证了该有效性指标的合理性。
其他文献
命名实体关系抽取是信息抽取领域的重要研究课题,从应用角度而言,它属于智慧搜索、自动问答、知识图谱等系统的关键技术之一;从基础理论研究而言,它对于机器翻译、文本分类、
加强核心素养教育,是落实立德树人、践行社会主义核心价值观的重要措施和必要途径。在核心素养提出的新时期,随着高中物理新课标的出台,对当前的实验教学也提出了更高的要求
石油从开采到最终使用的各个环节中导致的石油泄漏已造成严重的环境污染,微生物修复技术是治理石油环境污染最有前景的方法,掌握菌株的烷烃降解机理,是后期构建基因工程菌及
随着城市化的进展,农村的青壮年不断的前往城市务工,农村劳动力不足的弊端日益凸显。如今农村的剩余人口已经不足以支撑起传统农业所需要的繁重劳动。针对这一现象,如何充分
纳米金属颗粒因其高电荷密度,导致局域表面等离激元共振(LSPR)在可见光范围内。某些导电金属氧化物和掺杂半导体的电荷密度轻微降低将导致LSPR波长移动到近红外或中红外。本
本翻译报告取材于约翰·贝尔的法律学术著作《欧洲司法制度》第三章。该章详细介绍了德国的司法体系,包括法院结构,法院及法官的管理,法官角色的历史与价值,塑造德国司法文化
低维材料的性质与应用是目前热门的研究领域,黑磷是新兴的二维材料,因其优异性能引起了人们的广泛关注。黑磷纳米管可看作是将单层黑磷卷绕后形成的结构,本文利用黑磷纳米管
双语者与单语者语言转换过程中呈现的差异是心理学以及心理语言学中涉及的重要研究领域,Bialystok提出的双语者优势效应假说在学术界引起了广泛讨论。虽然针对该假说的研究很
当今技术的发展日新月异,包含智能家居在内的物联网系统逐渐走入寻常百姓家中。在相关的技术中,数能一体化网络技术犹如相关技术中的一颗明珠,愈发受到重视。在过往的有关数
河流湖泊中的氨氮污染问题在近年来越发严重,氨氮含量过高导致的系列问题成为河流等水体污染的重要原因之一,水体中氮元素超标不但会引起水体富营养化而且会对人体健康和水环