熵加权多视角核k-means聚类算法的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:ckforme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据的多样性使得传统的聚类算法已经无法满足数据分析的要求,于是人们提出了多视角聚类。现有的多视角聚类技术主要分为三类,协同训练算法、基于多核聚类算法和基于子空间的多视角聚类算法。但是多特征数据中可能存在受噪声干扰视角或无关视角,本文为了解决这个问题进行了相关的研究。首先研究了多视角算法的收敛性。多视角聚类能从根本上改善分类和聚类的结果,但只有这些算法是收敛的才能保证其有效性。本文用Zangwill收敛性定理对多视角核k-means(MVKKM)的收敛性进行了分析。结果表明,当满足一定的条件时,MVKKM生成的迭代序列收敛或至少存在一个子序列收敛于算法目标函数的局部极小值或鞍点。其次改进多视角核k-means算法,在基于视角加权的多视角聚类中,每个视角的权重取值对聚类结果的精度有着重要的影响。针对此问题,提出熵加权多视角核k-means(EWKKM)算法,通过给每个视角分配一个合理的权值来降低噪声视角或无关视角对多视角聚类的影响,进而提高聚类的精度。EWKKM算法中,首先用核矩阵表示不同的视角,给每个视角分配一个权重;然后,利用信息熵计算出各个视角的熵权重;最后,按照定义的目标函数对各个视角的权重进行优化,使用核k-means进行多视角聚类。最后,基于人工数据集和真实数据集进行了实验,实验的结果表明了该算法的有效性。
其他文献
随着网络和多媒体技术的发展,视觉通信的需求急剧增加,数字视频技术在通信和广播领域获得了日益广泛的应用。视频信息和多媒体信息在Internet和移动网络中的处理和传输技术成
随着三维扫描和建模技术的发展,三维网格成为继声音、图像、视频之后的一种新型多媒体数据。由于三维网格数据规模和复杂程度的急剧增长,给三维网格的存储、处理、网络传输以及
学位
手语是听力障碍者在日常生活、工作中与人交流、表达意图的主要手段,然而当今社会中信息传播的主要方式都是建立在自然语言之上,对听力障碍者接受信息、融入社会主体造成极大的
学位
Web服务是近年来蓬勃兴起的一种分布式计算模型,能够实现在不同平台、不同程序设计语言编写的应用程序或应用程序组件之间无缝的互操作。随着Web服务标准的完善和支持Web服务
随着计算机多媒体技术的迅猛发展,人们可以方便地利用数字设备制作、处理和存储图像、语音、文本和视频等数字信息;与此同时,网络通信的飞速发展使得信息的发布和传输实现了数
TTCN-3测试语言作为国际上唯一的测试标准语言,广泛应用于协议一致性测试,互操作性测试等测试领域。使用TTCN-3进行测试需要解决的一个重要问题就是测试适配器和编解码器的开发
近年来,随着社会经济和汽车工业的飞速发展,道路上的交通问题得到前所未有的关注。车辆自组网(Vehicular Ad Hoc Network, VANET),作为未来智能交通系统的基础之一,通过车与
XML是一种用于数据交换和共享的自描述语言,已经成为互联网上数据表示和数据交换的标准。在数据传输及交换过程中,许多结构化或半结构化数据都以XML格式来表示,由此产生了大
学位
目前,互联网正在由传统Web的发布式站点逐渐向开放的,可读写的,交互丰富的Web2.0应用过渡,以适应个人用户逐渐参与Web站点的互动要求。传统的Web中的“点击-等待”模式,已经无法满
学位
闪存作为一种新型的非易失存储介质,诞生于20世纪80年代末,具有高速、抗震、功耗低以及小巧轻便等优良特性。而且闪存作为一种纯电子设备,能够克服传统的机械设备所造成的一