基于判别式非负矩阵分解算法的研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:wang5632968
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,发现高维数据存在的潜在信息,去除冗余特征,获得有效的低维表示,变得极其重要。非负矩阵分解(NMF)将原始数据分解为基于部分表示的基矩阵和有效低维表示,具有非负性和强解释性等优点,被广泛应用于高光谱解混、聚类、人脸识别与分析等领域。基于对现有NMF算法的研究,判别式非负矩阵分解(DNMF)解决了同一标签映射为单个点的问题,可以获得更有效的低维表示。因此,本文基于DNMF提出两种改进算法,解决其忽略数据固有的局部几何结构和数据中包含特异点两个问题。提出一种半监督NMF算法,特征保留鲁棒判别非负矩阵分解(FR-RDNMF)。该方法通过引入特征保留约束项和l2,1范数,使聚类簇的质心特征与原始数据特征成比例关系,保证系数矩阵的正交性,获得更适合聚类更稳定的矩阵分解结果。并且,通过数学理论推导给出相应的乘法更新规则、收敛性证明和复杂度分析。最后,通过实验证明该算法中特征保留项对聚类结果的重要性,以及四个数据集上的聚类结果都比其他方法更加有效。提出一种有监督NMF算法,鲁棒双图判别非负矩阵分解(RDGDNMF)。该方法通过引入双图正则化同时学习数据空间和特征空间的固有局部几何结构,使用效果更好的l2,1/2范数提高模型的鲁棒性。同理,给出相应的乘法更新规则、收敛性证明和复杂度分析。根据RDGDNMF学习到的投影矩阵,将原始数据映射到低维空间,使用K近邻(KNN)对数据进行分类。四个数据集上的实验结果表明,对映射到低维空间的数据,采用多个不同分类器的结果都优于其他方法,KNN效果最好。该算法收敛快且相对稳定,尤其适合人脸数据集。
其他文献
2020年9月以来,发展绿色经济,建设绿色社会,逐步实现“碳中和”已经成为我国未来发展的重要议题;在各行业奋力实现双碳目标的情况下,零能耗建筑是大势所趋,“绿色”逐渐成为房地产企业新主题,不少房地产企业都将“绿色产品研发、绿色地产运营、绿色生态打造”写入发展战略中。2021年8月,六部门联合发布的《关于推动公司信用类债券市场改革开放高质量发展的指导意见》指出房地产企业要寻找信用债融资新渠道,鼓励企
学位
一直以来,房地产企业普遍存在着高杠杆经营的问题,随着近年针对房地产行业的监管愈加严格,一些抵御风险能力较差的房地产企业陆续暴露出问题,房地产企业债务违约案例在2018年后开始快速增加,2021年房地产行业发生违约的债券共计51支,违约本金及利息共计453.70亿元。产业地产作为房地产行业的细分领域之一,近年发展迅速,但由于产业地产在我国的起步较晚,尚未形成成熟稳定的盈利模式,目前发展过程中仍存在着
学位
2020年,由于受新冠肺炎影响中小微企业面临着更多的融资困难。小微企业在促进我国经济平稳快速发展、为科技创新创造源源不断的获利、以及提高就业率以保持社会和谐稳定中具有举足轻重的地位,因此,如何解决小微企业融资难的问题,如何更好地为小微企业提供优质的服务在当前复杂的经济形势下有着举足轻重的急迫性与重要性。商业银行小微信用贷款在小微企业融资的选择上占主要地位,同时小微企业的一些固有特点使得小微信贷的过
学位
近年来,随着健康中国和深化医疗卫生体制改革等战略的提出,探索医保支付方式成为改革的重点研究内容。国家医保局已于2021年底正式启动DRG支付方式改革三年行动计划,旨在帮助公立医院提升成本管控意识,助力公立医院进行精细化运营管理。DRG(Diagnosis Related Groups)是指按照住院病人疾病严重程度、治疗方法复杂程度和实际资源消耗水平等对病种进行分组,同一组内的患者病情相近,费用相似
学位
心肌梗死(Myocardial Infarction,MI)是由心脏冠状动脉供血区急性或持续性缺血缺氧所导致的一种严重的心血管疾病。若未能得到及时诊治,会造成患者心肌细胞大面积死亡,从而引发不可逆的损伤,严重者甚至导致死亡。因此,MI及时准确的诊断是至关重要的。心电图(Electrocardiogram,ECG)是临床上诊断心肌梗死常用的辅助工具之一,MI发作时在心电图上的主要表现为ST段异常、T
学位
在大数据环境下,由于单台计算机的存储、计算能力和安全隐私等问题,传统的集中式优化方法可能不再可行,因此可以利用多台机器的优势对大型数据集进行存储、计算和分析.在分布式环境下,为了降低计算复杂度和通信成本、提高算法收敛速度,本文基于共轭梯度法提出了两种分布式优化算法,分别用于求解线性回归模型和Logistic回归模型的优化问题.具体地,包括以下两部分:(1)针对大型线性回归模型的优化问题,在分布式环
学位
碳达峰和碳中和的目标一经提出,相关的绿色理念即成为讨论的焦点。房地产企业一向对能源消耗较大,大量的碳排放也给环境产生沉重负担。在此背景下,房地产企业需进行绿色转型。然而较大的融资约束、高昂的建设成本等都制约着企业开发绿色建筑的动力。作为绿色金融体系中的一部分,绿色债券是使资金流向绿色环保项目的重要金融工具,也是引导房地产企业发展绿色建筑的关键途经。本文从文献研究和理论分析出发,梳理了绿色建筑、绿色
学位
如今全球经济一体化趋势不断增强,国家彼此之间的竞争压力越来越大。为了全面推进科技强国的贯彻落实,我国必须建立符合自身实际需求的科创企业和产业链。由于技术创新型企业所处行业风险较高、前期开发投入较大,需要足够的资本作为后备力量保障其不断发展壮大。因此不管是从国家战略发展还是现实需要来看,针对科创服务层面的不足,资本市场应该予以有效弥补。正基于此,习近平总书记于二零一八年十一月宣布在上海上交所成立科创
学位
经过多年发展,房地产行业已成为我国国民经济支柱行业。然而,房地产行业存在着以高杠杆扩大企业规模,获取市场份额。“借新偿旧”、“借短还长”运营成为部分房企运营常态。2020年8月,住建部与央行共同发布“三道红线”融资新规。自此拉开了此轮房地产强监管的序幕。在此背景下,大体量上市房企华夏幸福2021年初突然出现债务违约,违约金额高、影响大,具有典型性和代表性。本文以华夏幸福作为案例,运用文献研究法、案
学位
计算机断层扫描(Computed Tomography,CT)技术可以对胰腺器官的位置、形态和组织等信息清晰成像,是病灶准确定位、医生定量分析及提供解剖学结构研究的重要前提。通过计算机高效的影像处理能力,精准高效的从CT影像中分割胰腺器官,不仅可以辅助临床疾病诊断、更对肿瘤消融手术的制定有着十分重要的意义。本文通过分析临床医生认知CT影像胰腺器官的特点,从2D分割算法和3D分割算法两方面进行研究,
学位