【摘 要】
:
谱聚类作为聚类算法中较为优秀的算法,近年在各个领域取得了不错的进展。相比较单视图,许多现实世界的应用程序涉及从不同视图收集的数据,并且具有较高的数据维度和不可避免的噪声。由于维度灾难、无效去噪和多视图集成的结果不佳等问题,在此类高维且含有噪声的数据集上进行聚类仍然是一个挑战。因此如何设计一种算法,使得算法能够有效的处理高维含噪数据,对于多视图聚类有着重要的意义。在收集数据的过程中,数据总是处于不断
论文部分内容阅读
谱聚类作为聚类算法中较为优秀的算法,近年在各个领域取得了不错的进展。相比较单视图,许多现实世界的应用程序涉及从不同视图收集的数据,并且具有较高的数据维度和不可避免的噪声。由于维度灾难、无效去噪和多视图集成的结果不佳等问题,在此类高维且含有噪声的数据集上进行聚类仍然是一个挑战。因此如何设计一种算法,使得算法能够有效的处理高维含噪数据,对于多视图聚类有着重要的意义。在收集数据的过程中,数据总是处于不断增加的状态,有些数据不可能一次性得到。传统的谱聚类对动态增加的数据集进行聚类,需要重复运行算法,导致所花费的时间较长,效率较低。因此如何设计一种算法,使得算法在有效的处理增量数据的同时可以减少时间开销,对于增量数据的多视图聚类具有重要的意义。本文主要是为了解决高维且含有噪声和样本动态增加这两种不同类型的数据的聚类质量问题,研究内容如下:(1)针对含有噪声的高维多视图数据,鉴于l2,1-范数在处理含有噪声的数据方面的优势,本文提出一种基于l2,1-范数的鲁棒自加权多视图投影聚类算法(RSw MPC),该算法能够同时进行降维、抑制噪声和学习局部结构图。同时得到的最优图可以直接用于聚类,而不需要进一步的处理。此外,该算法还采用了一种自动学习各个视图最优权重的新方法,无需生成额外的参数来调整权重。在不同的合成数据集和真实数据集上进行大量实验,结果表明,相比较其他最新相关算法,RSw MPC算法在处理高维含有噪声的数据时具有很大的优势,可以获得较好的聚类性能和鲁棒性。(2)针对增量数据,本文提出一种面向增量数据的多视图聚类算法(IRSwMPC),该算法对已有的数据利用RSw MPC算法进行聚类,从而获得所有簇。算法通过构造一种基于特征值增量的判断指标,在已知新增加样本假设归于每个簇后所得到的特征值增量的情况下,可以快速判断新增加的样本所属类别,不需要重复运行聚类算法,提高了算法效率,降低了时间复杂度。在真实数据集上进行实验,验证了IRSwMPC算法在处理增量数据时的高效性。
其他文献
寒武纪是人类历史长河中不容忽视的一部分,其遗留下来的化石成为了现代人观察和研究寒武纪生物大爆发以及进化发展的可靠依据,随着当前古生物研究领域中化石模型使用率的逐渐增高,也暴露出了模型重建难度大、价格昂贵、过程繁琐以及耗时长的问题。本文通过化石的光学多角度图像,对古生物化石的三维重建方法进行了研究,以下为研究内容:(1)针对目前化石重建过程繁琐问题,通过对光学重建方法的比较,选择从运动中恢复结构(S
图像是人们从外界获取和交换信息的重要来源,然而图像采集过程中通常存在物体运动、相机抖动等因素,造成采集图像模糊失真,严重影响了图像观赏的舒适度和满意度,给后续图像分析理解带来极大障碍。因此,从失真的图像中恢复出清晰可观图像的去模糊技术研究极为重要。近年,基于深度学习的方法大多通过增加网络复杂度来改善去模糊效果,虽然使效果得到了提升,但却增加了算法的运行时间。有时也不可避免的引入了伪影,且可能无法处
无源物联网的标签摆脱了对电源的依赖,具有体积小及成本低的优点,适用于仓储等需要密集部署的行业,通过在货品上附着标签,并与标签通信或对标签定位,可实现对货品远距离的查询和搜寻,提升工作效率,节约人力成本。然而,传统射频识别(Radio Frequency Identification,RFID)标签的通信距离有限,不能适用与大范围的仓储场景,造成这一问题的原因在于:其一,在下行链路上,低功耗限制使得
近年来,高后果区的油气管线安全问题引起了国家的极大重视。目前,我国广泛采用的管线巡检手段以人工巡检为主,智能巡检为辅。由于管线附近施工频繁,各类工程车破坏性大,因此有必要在智能巡检过程中通过固定监控或巡检无人机获取工程车的类别及行为等信息,以进一步提高管线安全。在此背景下,本文设计并实现了一种针对工程车辆的智能识别系统,该系统能够实现施工场景中多种工程车的运动检测、目标检测、目标跟踪与行为识别等功
JavaScript凭借其动态、交互、跨平台等特性,成为嵌入式物联网设备广泛使用的编程语言。为了在物联网设备上解释执行JavaScript程序,各类嵌入式JavaScript引擎被大量开发。然而,由于编程人员水平参差不齐,对JavaScript引擎设计规范理解偏差,导致开发的JavaScript引擎存在安全缺陷、功能缺陷和性能缺陷等问题。安全缺陷会使嵌入式设备面临安全风险,功能缺陷会影响JavaS
基于Wi-Fi信号的无线感知技术具有成本低廉、易于部署、隐私保护性好等优点。其中,手势识别由于其在智能家居和自动驾驶等前沿应用中的广泛需求,逐渐成为物联网领域研究的热点。然而,现有手势识别技术面临跨目标识别精度降低甚至失效的问题,即由于不同用户的身高、体型以及手势习惯等差异,导致利用已训练好的识别模型对新用户进行手势识别时性能大幅下降。针对该问题,本文提出一种基于Wi-Fi和视频相结合的低成本跨目
随着计算机视觉领域的不断发展,以及人机交互需求的提升,基于计算机视觉的手部姿态估计方法近几年来层出不穷。深度卷积网络的提出对手部姿态估计研究发展有着显著的效果提升,具有极大的应用意义与研究潜力。目前为止,三维手部姿态估计的方法根据输入信息不同可以分为两种:一种方法为基于普通单目RGB图像,另一种则基于深度图像或RGB-D序列。在基于深度图像的手部姿态估计方法中,一些方法取得了较好的实验结果。但由于
随着信息技术的发展,由于推荐系统通过采用海量数据挖掘的方式,为用户快速准确地筛选出所需要的信息,提供个性化服务和决策支持,而成为近年来的研究热点。特别是随着深度学习的发展,研究人员已经提出了大量高效的智能推荐算法和应用平台。但是由于推荐系统的数据稀疏性、冷启动以及难以解释性等问题,个性化推荐方法仍存在一些问题亟需进一步的改进。本文通过结合用户评论信息缓解数据稀疏性和冷启动问题,并结合上下文信息,构
尿液中的主要成分来自于血液经过肾脏过滤、重吸收后产生的排泄物,与人体的血液循环、泌尿系统、循环系统等密切相关,因此尿液检测对于医学研究与临床诊断具有重要的价值。由于尿沉渣检测技术受制于显微成像较差的稳定性,目前的尿沉渣检测方法仍然依赖于人工镜检法。临床通过显微镜成像采集的尿沉渣图像容易出现失焦,导致人工镜检的过程中过分依赖主观经验判断。本文的研究旨在解决尿沉渣显微图像画面整体失焦以及有形成分边缘模
众包平台“海纳百川”,集中群众智慧,完成凭个人力量难以完成的任务。对于特定任务,招募最佳的工人子集是任务顺利完成的关键,即工人招募(任务分配)乃众包平台的基本任务。任务具有各自的完成质量需求和预算限制,若任务完成的质量不小于需求,则任务顺利完成,否则失败。工人参与任务,由任务发布者支付报酬,报酬取决于工人的技能水平。工人和任务均有不同的偏好,任务偏好高水平工人,而工人偏好性价比高的任务。如何在任务