模糊聚类算法研究与实现

来源 :江苏科技大学 | 被引量 : 3次 | 上传用户:zkk81950868
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊聚类是对没有标签的数据集进行有效划分的重要手段之一。随着大数据时代的到来,数据量呈指数增长,然而大多数数据是没有标签的,如何将这些数据准确分类,并为用户提供更准确的服务成了当今社会重点研究的方向。经典的模糊聚类算法(Fuzzy C-means,FCM)因其简单高效得到广泛应用,但其隶属度和为1,数据集中的噪声点和野值点对最终聚类结果影响较大。可能性C均值(Possiblity C-Means,PCM)算法打破隶属度和为1的限制,降低了噪声点和野值点的影响。FCM和PCM算法在对高维数据集进行聚类时,计算效率往往很低下,核函数的引进大大提升了算法对高维数据集进行计算的效率,在FCM和PCM的基础上分别提出了核模糊C均值(Kernel Fuzzy C-means,KPCM)和核可能性C均值(Kernel possiblity C-Means,KPCM)。然而,上述四种聚类算法依旧存在两大问题:忽略类间元素的关系以及初始聚类中心是随机选取的。本文从类间元素的关系、初始聚类中心两方面进行研究,并取得如下成果:针对传统的聚类算法只考虑类内元素的关系而忽略类与类之间关系,对边界模糊的数据集进行处理时,会造成边界点的误分问题,本文在KPCM的基础上提出了一种基于改进核可能性C均值类间极大化聚类算法(Kernel Possibility C-means Maximization,KMPCM)。该算法结合KPCM的目标函数,再施加极大惩罚项,使得类与类中心间的距离拉大,这样就考虑了类间元素的联系,能较好的划分边界处的样本。针对随机选取初始聚类中心导致传统聚类算法的最终结果不稳定的问题,可根据样本分布的紧密度信息,采用最小方差优化初始聚类中心。该初始化算法根据样本的空间分布信息,计算样本的方差得出样本的紧密度信息,选择方差最小的样本点及其一定范围内的样本点作为初始聚类中心,结合KPCM和KMPCM实现改进的模糊聚类算法。该算法由于能取得较好的初始聚类中心,因此能取得较好的聚类结果。但此方法的时间、空间复杂度较高,在处理大量数据集例如图像上时会显得效率不高。本文研究了图像分割中几种经典的方法,图像中像素点灰度值相近和存在噪声点会导致图像的分割效果不理想。针对上述问题,尝试将本文提出运行效率较高的KMPCM算法应用到图像分割中,并与FCM、PCM、KFCM、KPCM算法进行实验对比,实验结果表明KMPCM在图像分割的应用效果更佳。
其他文献
非接触式纳税服务是“互联网+”时代发展的产物,是税务部门深化“放管服”改革,实现纳税人离厅办理的重要内容和手段,同时也是税务部门应对流行性病毒(如2019新冠病毒)对外提倡的主要办税方式。本文以T区税务局非接触式纳税服务工作为研究对象,以国地税征管体制改革后的工作成果为研究内容,基于新公共管理理论、税收遵从理论,发现存在着纳税人需求实现机制缺失的问题,即纳税人需求不清、价值挖掘不足,网上办税信息系
《南方有令秧》是对女性缄默历史的一次重返。小说首先以丈夫的死亡赋予令秧言说自我的可能性,再借助于对秩序话语的利用与播弄,使令秧宣扬了节烈之名。令秧言说的实现是因为节
信息一体化时代,现代媒体借助互联网东风不断拓展对经济社会影响力,媒体在公司治理中也发挥着越来越重要的作用。特别是上世纪末以来,随着信息技术快速发展,媒体种类结构也发
目的在了解国内外临床专硕生培养模式的实践经验与相关研究的理论基础上,以专硕生的培养质量为切入点,利用柯氏四级评估模型,通过调查与问题反馈,分析临床医学专业学位硕士研
当今世界,国际间的竞争日益激烈,而我国得益于创新驱动发展战略的实施,已成为当今世界第二大经济体,最大的发展中国家,产业结构不断从中低端向高端迈进,由过去的“中国制造”
在我国,公立医院一直是医疗服务的主体,其发展直接影响着整个医疗活动。近年来,随着我国的医疗卫生事业快速发展,医疗服务的需求显著增加,很多公立医院的规模在逐渐扩大。由
长篇小说《乘风的岛屿》将20世纪30年代济州海女的抗日斗争故事与济州岛的特殊环境联系在一起,深刻描绘了日本殖民统治下济州海女的抗日事迹与抗日精神,也体现了济州岛不同于
计算机断层成像技术(CT)是通过对物体进行不同角度下的射线投影测量而获取物体横截面信息的成像技术,它在非接触、非破坏物体内部结构前提下,能高精度重构三维物体结构信息,
<正>1991年,Mroz和Tarkowski应用以谷物和蛋白质补充料为基础的浓缩日粮对妊娠母猪进行限制饲养,使得妊娠母猪的采食量约相当于自由采食量的50~60%.这种限制饲养对于防止母猪
建立了饲料中没食子酸含量测定的高效液相色谱测定方法。样品经加热超声提取,再经C18色谱柱分离,利用高效液相色谱仪进行定性、定量分析,采用外标法定量。结果表明,没食子酸