【摘 要】
:
大数据时代,人们日常生活中处处都在积累着数据,从而导致大量的数据在不停的堆积,这些数据的内在价值是让很多学者们去研究聚类算法的动力。聚类算法的出现,使得巨大的数据得以发挥背后隐藏的价值。聚类有效性指标是对聚类结果进行评价,对于发现正确聚类数起到关键性的作用,然后现有指标存在簇中心分布很接近时难以得到正确聚类数、分离性处理机制过于简单、面向含噪声的数据集效果较差的问题。为此,本研究面向模糊聚类提出了
【基金项目】
:
国家自然科学基金项目(编号:61673156),协同对称蕴涵熵推理及其在情感计算中的应用研究,直接经费62万; 国家自然科学基金项目(编号:61203077);
论文部分内容阅读
大数据时代,人们日常生活中处处都在积累着数据,从而导致大量的数据在不停的堆积,这些数据的内在价值是让很多学者们去研究聚类算法的动力。聚类算法的出现,使得巨大的数据得以发挥背后隐藏的价值。聚类有效性指标是对聚类结果进行评价,对于发现正确聚类数起到关键性的作用,然后现有指标存在簇中心分布很接近时难以得到正确聚类数、分离性处理机制过于简单、面向含噪声的数据集效果较差的问题。为此,本研究面向模糊聚类提出了两种新的聚类有效性指标:三重中心关系TCR(Triple Center Relation)指标和THI(Tang-Huang Index)指标。本论文的主要工作如下:(1)对模糊聚类算法进行简单的介绍,由于聚类有效性指标的研究是基于聚类算法的,因此在对数据集样本进行分析的时候首先要进行聚类,使用工具将数据集分成不同的簇。然后使用聚类有效性指标函数对聚类结果进行评价。进而知道使用的聚类算法是否有效。本文使用的是模糊C-均值(Fuzzy C-means,FCM)聚类算法。(2)提出了一种名为三重中心关系TCR指标。指标是从传统的紧致性和分离性两个方面进行刻画的。TCR指标以最大隶属度为切入点建立了一种新的模糊基数,同时将其与类内加权平方误差和进行结合,由此建立了新的紧致性公式。从聚类中心的最小距离出发,融入了聚类中心距离的均值,以及统计意义上的聚类中心的样本方差,三者采用乘积的方式进行复合,构成了更为立体的分离性表达模式。在UCI数据集和人造数据集进行实验,从理论和实验两个方面说明新指标的优势所在。(3)提出了一种新指标THI指标。新指标是从一个新的方向对紧致性和分离性进行描述,对以往指标的缺点进行了总结和改进,使得指标计算更加简便并在遇到复杂的数据集也能得到比较好的结果。指标的好与不好都是需要现实数据进行实验的,所以本指标毫无例外的在现实和人造两个类型的数据集上进行实验,实验结果表明新提出的指标具有更好的评价意义。
其他文献
傅里叶叠层显微成像技术(Fourier ptychographic microscopy,FPM)是一种可以同时兼顾高分辨率和大视场的新型成像技术,它主要是由结构照明、叠层成像、相位恢复三大部分组成。在基于LED阵列照明作为光源的传统FPM系统中,通过依次点亮光源阵列中的LED,由于各位置LED对样品的照射角度不同,可以采集一组包含不同频域信息的低分辨率图像,这些图像随后通过相位恢复算法,在傅里叶
随着物联网(Internet of Things,Io T)以及边缘计算的发展,数据安全问题逐渐成为研究热点。由于Io T场景复杂多样且存在较多资源受限平台,传统的密码算法难以进行有效部署。针对已有的认证加密方案资源消耗大的问题,本文采用轻量级分组密码算法与伽罗华/计数器模式(Galois/Counter Mode,GCM)相结合的方案,实现了Io T场景下的轻量级认证加密引擎。本文在深入研究GC
当下网络技术不断创新,互联网行业自身发展趋于成熟,与各领域的关系愈发密切,互联网产品数量呈爆发式增长,导致产品同质化严重、用户流失、获客成本高昂等问题。用户使用APP过程中的决策行为,是APP用户的长期稳定使用产品的关键。聚焦APP用户不同决策场景与阶段的情感体验,以情感代入的方式来引导APP用户使用中的决策行为,维持良好的情感关系,形成稳定的使用习惯,是本文研究的重点。本文基于APP用户情感代入
光场相机是一种新型的多目成像设备,通过单次拍摄可获取场景的空间和多视角信息。利用光场数据可以估计场景深度,在三维重建等计算机视觉领域具有广泛应用。目前,基于深度学习的光场深度估计性能得到了显著提升,但随着输入成本的增加以及网络的加深,现有的光场数据集难以支持大规模网络的训练。同时,经过合成场景训练后的网络,在真实场景下的估计效果不佳。围绕上述问题,本文对光场重聚焦原理以及EPI图像进行分析,开展光
随着互联网时代的发展,信息安全问题日益突出,数字水印作为版权保护和身份认证的手段备受关注。它常用于地质勘察和军事通信等领域。为了保护勘察信息,同时避免图像被恶意盗取和篡改,人们将需要保护的信息当作水印嵌入到图像中。又由于户外勘察会受到天气的影响,遇到雾霾天气时会使拍摄到的图像质量降低。为了提高图片的质量,去雾也成为研究的热点问题。针对以上问题,本文提出一种基于去雾加速器的数字水印系统,在去雾的同时
目前,全国主要的医疗机构基本上都搭建各自的网上预约挂号系统或者电话挂号系统,但是从近些年的运行效果来看,预约挂号的放号量和使用率都不高。而且存在一些问题,如上办事大厅虽然有统一接入平台,但是预约挂号的提示不明确,医院出诊表不统一,存在各式各样现象,人机交互程度较差,群众使用起来极为不便等问题,有些还是单一PC端网站预约挂号平台,这些平台已难以满足患者的需求。随着移动互联网技术已经突飞猛进发展,预约
生物特征识别技术是最有效的个人身份认证解决方案之一。随着生物特征识别技术的广泛应用,生物特征识别数据库的规模不断扩大。在这种情况下,快速匹配和检索技术越来越有必要。掌纹识别技术是近年来新兴的生物识别技术之一。在掌纹识别技术中,有多个子类别,包括低分辨率掌纹识别和三维掌纹识别技术等。研究者们已经提出许多掌纹识别算法。而对快速的掌纹检索的算法研究还处于起步阶段。哈希技术是最流行的图像检索技术之一,由于
随着科技的发展和公共安防需求的增加,智能监控系统的部署成为了一种流行趋势,其核心是行人再识别技术。本文首先简要介绍了行人再识别研究的意义、现状、挑战;接着深入研究行人再识别的理论知识,概述了行人再识别发展至今的经典算法;然后针对行人图片错位、遮挡、无关信息干扰等问题,对融合全局特征与局部特征的行人再识别算法进行研究,以上述两种类型特征的有效提取方法为切入点,做了以下研究工作和算法创新。第一个工作是
光场相机通过对单个场景进行多视角密集采样,使得高精度深度信息的挖掘成为可能,在深度传感器中不论在便携性还是深度精确性方面都具有显著优势。现有的深度估计方法不能很好处理遮挡和噪声问题,特别是对于包含遮挡区域的噪声场景,遮挡和噪声的同时存在将使深度获取难度进一步加大。本文分别围绕遮挡和噪声这两大难点问题对光场深度估计展开研究。论文的主要研究工作如下:(1)概述光场深度估计原理以及国内外的应用场景和研究
水下图像是获得水下场景信息的重要媒介之一,在水下探测、海洋研究等领域都扮演着重要角色。然而,光在水下传播时会与水体产生强烈的吸收与散射作用,导致水下成像质量下降,严重限制了水下的可视范围。因此,水下成像及复原技术在水下救援、海洋探索以及海洋目标识别等领域都有着重大意义和实际价值。本文首先针对水下图像中散射光去除的问题,采用分层思想分离图像中的散射光,实现了水下图像复原,提高了水下图像的质量;其次针