基于监督信息特性的主动半监督谱聚类算法

来源 :电子学报 | 被引量 : 0次 | 上传用户:shanzhaokai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督聚类是利用少部分监督信息辅助大量未标签数据进行非监督的学习,其聚类性能的改善依赖于监督信息,因此挖掘适合半监督聚类的监督信息非常关键.提出了一种基于监督信息特性的主动学习策略,即找出同一类中距离相对较远的数据对象对和不同类中距离相对较近的数据对象对组成监督信息,并将其引入谱聚类算法,构建新颖的主动半监督谱聚类算法ASSC(Active Semi-supervised Spectral Clustering).利用该监督信息调整谱聚类中点与点之间的距离矩阵,使类内各点紧聚,类间散布.通过对UCI基准数据集以及人工数据集的实验结果表明,ASSC算法优于采用随机选取监督信息的谱聚类性能.
其他文献
本产品利用热泵技术将排水的部分热能回收利用,使系统排水温度降低,回收的热量由热泵系统提升为可再次利用的生活热能。与现行热泵式热水器相比,该热水器有如下特点:
做中国人,写中国字。汉字,是中华民族五千年的文化代表,是民族的希望和未来,写好汉字是每个炎黄子孙必做的一件事,是继承和弘扬民族优秀传统文化的一项基础工程,是素质教育的重要组成部分。它的形体美感染了每个中国人。作为一个中国人,要尽自己的绵薄之力把汉字文化传承和发扬下去,写字要从孩提时代抓起。如何写好字呢?语文教师又怎样进行写字教学呢?这是我们应该思考的问题。我个人认为,每个中国汉字如一个个跳动的音符
文章在投资者期望效用最大化假设的基础上,引入通货膨胀因素,考察了利息税对储蓄的影响。结果发现,当征收利息税时,储蓄额反而增加了,而不是通常认为的利息税会减少储蓄。其原因在
为解决DOCSIS上行发射器的高功耗问题,本文在深入剖析信道突发特点和发射器结构的基础上,提出了一种全新的发射器VLSI(超大规模集成电路)设计低功耗体系.通过引入发射符号率这
增大传感器振子的质量和静态测试电容可以减小电容式MEMS惯性传感系统的噪声,而深度粒子反应刻蚀工艺由于复杂的工艺原因,当深宽比较大时,不能刻蚀出大质量和大初始电容的传感器
装箱问题在实际生产中应用非常广泛,本文在分析该问题特点的基础上,提出了使用类CF近似算法和人工鱼群算法相结合的混合人工鱼群算法求解装箱问题,并给出了具体的算法步骤。跟遗
提出了一种直接在JPEG图像压缩域进行肤色检测的算法.该算法首先在熵解码后的DCT系数中提取图像块的颜色特征和纹理特征,然后利用数据挖掘建立用于表征压缩域图像特征和肤色检测结果之间关系的肤色模型,并利用该模型进行初步肤色检测,最后利用区域生长的方法分割出图像中的肤色区域.实验结果表明,与像素域的SPM(Skin Probability Map)肤色检测算法相比,本文方法可以获得更高的检测准确率和更
针对不平衡数据流的分类问题,结合基于权重的集成分类器与抽样技术,本文提出了一种处理不平衡数据流集成分类器模型.理论分析与实验验证表明,该集成分类器具有更低的计算复杂
股票挂钩票据(Equity Linked Note)是结构性金融产品的一种,是一种衍生投资工具,由定息投资工具(如债券)和期权(认沽期权或认购期权)所组成。股票挂钩票据可能提供很高的收益,也可能带
施用农药要讲科学,尤其是冬季大棚蔬菜的农药施用更是如此。否则,不但达不到防治效果,还容易发生药害。因此,施用农药要注意十忌。