非负矩阵分解及其在非均衡数据分类中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lss81
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非负矩阵分解(NMF)是一种处理大规模高维数据的矩阵分解方法,它以非负约束和局部表示等独特的优势吸引了众多研究者的关注,并被广泛地应用于数据挖掘、计算机视觉和模式识别等领域。此外,实际的分类问题中存在很多非均衡数据,包括密度不均衡、类别不均衡和常见的样本数目不均衡等情况。基于此,本文重点研究了基于数据结构信息的非负矩阵分解算法和面向非均衡数据分类的非负矩阵分解算法。首先,概述了非负矩阵分解及非均衡数据分类的基础理论。给出了NMF基本算法、数学求解方法,以及经典的衍生算法;并总结了数目不均衡数据的分类难点及常用的抽样处理方法。其次,针对基于图信息的非负矩阵分解仅用欧式距离来衡量样本邻域结构的局限性,将邻域样本相似度引入非负矩阵分解,提出一种基于邻域样本相似度的非负矩阵分解算法(NSS-NMF)。该方法通过引入邻域协方差矩阵来计算邻域样本相似度,对于邻域结构相似的样本点,其分解所得的系数矩阵的约束项被赋予较高的权值,以适应于样本密度不均衡的情况;进一步,引入邻域类标相似度,并考虑基向量的正交性,提出一种基于邻域相似度的非负矩阵分解算法(NS-NMF)。该方法在考虑邻域样本相似度的基础上,根据邻域样本的已知类标信息构建邻域类标分布矩阵,这样组合得到的邻域相似度有效地兼顾到数据类别分布不均衡的情况。实验结果表明,上述基于数据结构信息的非负矩阵分解算法可以获得比传统方法更好的聚类分类性能。最后,针对常见的非均衡数据问题(即样本数目不均衡),提出一种新的加权非负矩阵分解算法(WNMF)。该方法通过计算每类样本数在总样本数中的比例,求其倒数作为训练样本的权值引入非负矩阵分解,因此在保持了多数类分类准确性的同时,有效地提升了少数类样本的分类性能。此外,结合NS-NMF算法考虑了邻域结构信息的优点,提出一种基于非负矩阵分解的混合重采样算法(HS-NMF)。该方法先通过NS-NMF将数据集映射到更加可分的子空间,再通过经典的过采样、欠采样技术改善数据的不均衡程度。实验结果表明,将非负矩阵分解应用于非均衡数据分类中,可获得比传统重采样方法更高的分类准确率。
其他文献
目前,嵌入式系统以其可靠性强、体积小、专用性、成本低等特性得到日益广泛的应用。新一代嵌入式系统的功能集成和应用模式使之迅速向网络化嵌入式计算的方向发展,嵌入式环境
视频编码技术日新月异,广泛应用于网络流媒体点播,视频监控,VCD,DVD,数字电视广播等领域。视频编码的压缩效率不断提高,适用范围越来越广。视频技术和计算机网络技术以及无线通信技
本论文主要包含以下内容。首先,回顾了视频压缩编码技术和数字图像处理中的图像插值的背景知识 ,归纳分析了在近年来常用的视频压缩标准中分数像素插值的各种技术和方法。其次,
有机电致发光器件因有机材料选择范围宽,原料便宜,制作工艺简单,可以制作在柔性衬底上,主动发光,无视角依赖性,响应速度快,能耗低,低压直流驱动且可以和集成电路相匹配,发光亮度高,易于
随着社会的发展,工业机器人产量逐年增加,但根据最新预测,到21世纪,家用机器人将成为机器人制造业的主力机种。工业机器人主要用于以工厂为代表的第二产业,而家用机器人则主要用于
目前国内外使用的眼压测量技术主要采用接触测量法,激光干涉式眼压仪是利用激光干涉的原理对眼压进行测量,这种方法是非接触式测量,病人无痛苦,不会产生交叉感染。同时测量精
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)技术通常利用微波数据获取高分辨率的雷达图像,其可以对诸如卫星、太空站、飞行器、船舰等空间和空天目标进行远距离
  本文首先对跳频分组无线网络中存在不同干扰的情况下的误码率,删码率进行分析,并且对最小阻力路由的路由算法进行深入研究,通过OPNET仿真工具对采用不同算法的LRR进行仿真。
  论文总结笔者参加科研项目的研究心得,参照3GPP、W3C等组织制定的标准规范和建议草案,围绕下一代网络中基于XML的业务提供进行深入的研究和探讨。  论文首先就XML的基础
  会话发起协议SIP是IETF制定的多媒体通信系统框架协议之一,是一个基于文本的应用层控制协议。SIP独立于底层协议,用于建立、修改和终止分组网上的双方或多方多媒体会话。随