基于深度学习的半监督聚类算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:duyyy12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的迅速发展,手机等电子设备的逐渐大众化,人们时刻不停的在和外部环境交换数据,由此产生的数据资源呈现爆发式增长。海量的数据资源中虽然蕴藏着诸多信息,但从中获得具有指导意义信息的难度也随之增加了许多。因此如何有效利用这些数据,从中准确、快速地分析提取出符合人们要求的信息成为符合时代要求的研究课题。聚类方法是数据挖掘领域中较为主要的基础之一,已经获得了广泛的研究。但在真实情况中,一般都能在海量数据中得到部分与之相关的先验信息。半监督聚类方法是在融合少量先验信息的基础上对传统聚类方法的改进。但是如何能够更加有效地利用这些先验信息,进一步提高聚类方法的性能,吸引了研究者的广泛关注。本文基于深度学习技术,提出了两种半监督聚类算法,有效地提升了聚类方法的性能。(1)提出了基于标签自适应策略的半监督深度聚类算法。算法首先使用深度编码网络实现数据由原始空间到特征空间的映射,克服“维度灾难”问题的同时学习有益于聚类分配的特征表示。接着设计了一种标签自适应策略来解决聚类分配标签和样本实际标签不一致的问题。该策略能够利用标签信息指导簇心的优化调整,从而达到提升聚类性能的目的。(2)提出了基于成对预测的半监督深度聚类算法。首先通过对生成对抗网络进行反向映射,获得能够拟合数据真实分布的潜在特征空间。接着基于已知的成对约束信息,通过双网络模型完成对数据集中无标记样本对的关系预测,得到数据集中全部样本对的约束关系,并在此基础上完成聚类任务。本文在公开数据集上进行了充分的实验,并选择几种目前半监督聚类领域中较为典型的算法进行对比。实验结果证明本文算法较其他对比算法取得了更优的性能表现,具有一定的研究和应用价值。
其他文献
唐口煤业有限公司(以下简称"唐口煤业")作为淄矿集团在济北矿区兴建的骨干企业,继承集团红色传统,为真正发挥党组织在企业经营工作中的引领和支撑作用,系统构建了"五治"党建品牌体系。"五治"包含政治、法治、德治、自治、智治,之间相互协同,是一个有机的整体:政治是引领,淬炼思想;法治是保障,规范行为;德治是滋养,和谐团队;自治是基础,强化素质;智治是手段,助力发展,五个维度协同用力,共同支撑唐口煤
期刊
在任务型人机对话系统中,槽抽取任务是至关重要的一个环节。为了提高槽抽取模型的识别准确率,该文提出了一种利用自注意力机制融合文本的多特征维度特征的方法。该方法在常规的双向长短期记忆模型(Bi-directional long short-term memory, Bi-LSTM)和条件随机场(Conditional random field, CRF)的槽抽取模型基础框架之上,引入了自注意力机制融合
三维重建在计算机视觉与深度学习等领域是一个长期存在的关键问题,在近几十年得到了广泛的关注与研究。在基于图片完成三维重建中,由于物体部分遮挡导致未知信息增加使这项任务有很大的不确定性。虽然使用多个角度的图像会降低三维重建的难度,但在现实生活中,物体单个角度的图像不仅更容易被获取,且从单张图像重建三维形状更具有实际意义。所以本文使用单张图像完成三维重建。然而,由于单张图像的自遮挡部分导致未知信息增多,
消息分享对个人和群体都很重要,人们之间的情绪和行为都可以通过消息分享进行传播。对于身心不成熟的大学生来说,他们更敏感、更容易受到谣言等非正常信息的影响。学生之间的友谊关系是消息分享过程中不可或缺的一部分,结合友谊网络探索学生之间的消息分享规律并且对消息分享关系进行预测,能够对一些行为异常、性格孤僻的学生进行识别,可以帮助高校管理者对学生提供更好的个性化指导意见。然而,目前国内外学者的研究主要集中在
图神经网络作为一种新的深度学习模型,被广泛地运用在了各种图数据和网络分析中,并且推动了推荐系统、知识图谱等相关应用的发展。然而在网络结构方面现有图神经网络算法只利用了成对连接的节点之间的关系,没有注意到现实网络包含大量的高阶结构。这些高阶结构反映了多个节点之间的相似性和连接关系。本文研究了网络中的两种高阶结构并将它们融入图神经网络算法中:(1)本文研究了一种少量节点形成的高阶结构,并提出了一种基于
本文研究了一类线性时不变(LTI)系统的模型预测控制(MPC)问题,该LTI系统以涡扇航空发动机为背景。第一,我们基于LTI模型,利用ADMM算法对涡扇航空发动机的MPC问题进行研究。在当前时刻k,我们首先基于LTI模型,借助MPC的基本原理推导出预测方程,其次利用预测方程把MPC问题转化为一个关于控制序列的二次规划(QP)问题,接着引入一个松弛变量将QP问题等价转化为一个带有等式约束的分块的适用
CMOS图像传感器(CMOS image sensor,CIS)因具有低成本,低功耗,集成度高等优点而广泛应用于生产生活中。随着其应用范围不断扩大,在太空,医疗,核能等领域,辐射引起的器件老化备受关注。总剂量效应是一种因电子器件长期受到高能辐射而出现的老化效应,器件的电学参数会随着辐射总剂量的累积而发生改变。随着我国航天航空事业的发展,总剂量效应对CIS性能参数的影响愈发引起人们的重视。4T结构的
横向压力监测在结构健康监测、医疗诊断分析、复合材料性能评估等领域有着重要的意义,近年来受到了研究者们的广泛关注。光纤传感器由于其体积小、灵敏度高及抗电磁干扰等优点被广泛应用于横向压力监测。目前,在横向压力监测领域对光纤布拉格光栅(FBG)传感器研究较为广泛,但由于其对多参数敏感,测量结果容易受到环境因素(如温度)变化的影响。光纤法布里-珀罗(F-P)传感器以其结构简单、灵敏度较高、稳定性较好及温度
微波光子学是结合了微波射频领域与光学领域的交叉学科。随着微波光子学的发展,研究人员尝试着将微波光子学应用于传感领域,称之为微波光子传感,其基本原理是将传感信息通过光信号形式转换成微波信号,通过对微波信号的测量实现传感的目的。微波光子传感能够提高识别速度和精度,更稳定、更易控制,具有良好的可重复测量特性。本文首先介绍了微波光子滤波器的基础理论,通过倾斜光纤光栅的模式耦合理论,分析了倾斜光纤光栅的传输