非负矩阵分解及其在高维数据应用中的研究

被引量 : 8次 | 上传用户:chenman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化和互联网的发展,高维数据在社会各领域不断涌现,如贸易交易数据、Web文档、病理诊断数据、多媒体数据及物流系统数据等等。总体来讲,这些数据都是半结构或者无结构的,使得构建这些数据的特征向量高达几万维甚至更高。特征维数的高维性带来的直接后果就是维度灾难(curse of dimensionality)。那么如何从这些高维数据中挖掘出对人类有价值的信息就变得更为棘手,成了亟待解决的重要问题。高维数据挖掘的一个核心内容是使用一种低维的具备清晰的潜在结构的方法来描述多维数据,切合人类感知机理(对整体的感知是由对组成整体的部分的感知构成)的非负矩阵分解(Nonnegative Matrix Factorization, NMF)方法应运而生。自提出以来,由于其良好的可解释性,NMF算法得到了广泛的关注和研究。然而,NMF算法存在的问题也是显而易见的:解的存在性和唯一性、低维空间维数的确定、很难处理低维线性不可分的数据集,以及样本之间局部一致性的合理引入。本文着重关注的是无监督的NMF算法和半监督的NMF算法,研究成果有二:一是提出了基于多核学习的投影非负矩阵分解(MKPNMF)算法,算法略去了核函数选取的步骤从而提高了算法的降维性能和时间性能;二是提出了自适应图约束的半监督非负矩阵分解(GCNMF)算法。在利用类标信息的同时,算法还合理利用了样本之间的局部一致性。在实际图像、人脸和手写体数据集上的实验结果证明,我们的方法较之于现有的无监督和半监督方法,在性能上相应的分别有所提高。本文最后,我们还对目前的工作进行了总结,并且对进一步的研究方向进行了汇总。
其他文献
近年来,我国篮球权威部门,提出了以“防守为主”的训练指导思想,无疑,这是一种观念的更新、一次认识上的突破。它适应了当代篮球发展的总趋势,从而为中国篮球运动面貌的改观
战丽彬教授主要研究方向为中医内科及妇科等疾病的诊治,对脾胃、风湿、妇科、肿瘤等疑难杂症尤为擅长。本人跟师,侍诊、抄方两年又半载,深感战丽彬教授对中医学深深的热爱,导师认
随着人类科学技术的进步和卫生条件的改善,人的期望寿命日益延长,使得老年人口在总人口中的比重逐渐增加,伴之而来的是慢性非传染性疾病逐渐增多,慢性病已经成为一个全球性问
传统的微生物分离与培养技术无法揭示微生物群落的动态变化.为了阐释虾池沉积环境微生态格局的原始组成情况,本研究先以TENP缓冲液去除沉积物中的腐殖酸,继之以溶菌酶-SDS温
项目要按计划实现其建设目标,都必须科学的、系统的应用项目管理方法,对项目建设全过程进行有效的计划、组织、领导和控制,确保项目按原定计划实施。要使项目建设任务在规定
本文结合浙江省交通厅科技项目“柔性生态挡墙在高速公路中的应用专题研究”,在文献调研和现场调研的基础上,依托现场实体工程建设,通过现场试验、理论分析与仿真分析,研究柔
一国或地区的经济发展,不再仅仅停留在单纯意义上的追求经济总量的增长,除了包括经济增长的因素外,还应包括诸如经济增长质量、经济结构变动以及社会发展和人民生活水平变化等更
本文是对高中历史必修Ⅱ中“中国近代经济史”部分的教科书编写及教学问题所做的一项专题研究。全文共分为三章,加上绪论和结语共五个部分。绪论部分主要介绍了选题的缘起、
本文从衡阳市基础设施项目融资出发,分析衡阳市目前项目融资的现状,并对此提出了政策建议。本文介绍了政府债券、商业银行贷款和城投债券融资方式,同时介绍了英国、日本、美
目的:在认真研究国内外有关满意度理论和实践发展的相关文献的基础上,用满意度测评模型,以广州市大学生医疗保险参保人员为调查对象,运用满意度调查量表进行广泛性的问卷调查,以相