非负数据处理快速方法及其应用研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:yoyoliuy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实中,很多物理量都具有“非负”特性,例如:灰度图像像素值、文章中单词出现的频数、用户体验的得分等。在分析处理这类数据时,为了增强结果的可解释性,往往需要其满足“非负性”约束。非负矩阵分解、非负张量分解和非负二次规划是三种常用的非负数据处理工具。非负矩阵分解是满足被分解矩阵和分解后的因子矩阵中所有元素均为非负数的矩阵分解方法。由于非负约束的存在,非负矩阵分解只允许加性的线性组合,这使得其分解结果是基于部分表示的,符合人们“由局部构成整体”的认知方式,具有较强的可解释性。非负矩阵分解已成为处理高维、大规模非负数据的一种重要方法,被广泛应用于模式识别、机器学习和信号分离等诸多领域中。作为矩阵的高阶推广,张量结构被越来越多的研究领域用于数据表示。非负张量分解是非负矩阵分解在高阶张量上的推广,其继承了非负矩阵分解的上述特征,是分析非负张量数据的一种有效方法。非负二次规划是一类经典的凸优化问题。许多非负数据处理问题都可以表示成非负二次规划问题或者和非负二次规划问题相关,例如:图像去噪、非负矩阵分解、贝叶斯网络密度估计等。目前,非负矩阵分解、非负张量分解和非负二次规划在算法以及应用方面的研究已经取得了很多成果,但仍然存在一些问题有待解决,例如:大部分非负矩阵分解算法都采用交替更新的优化方式,但这种方式对算法初始值较为敏感,容易导致算法收敛速度较慢;对称非负张量分解是一种重要的多维概率聚类方法,但目前相关的算法很少且普遍收敛速度较慢;许多非负二次规划算法在保证实现简便性时难以兼顾算法的收敛速度。因此,关于非负矩阵分解、非负张量分解和非负二次规划快速算法的研究具有重要的意义。围绕该问题,本文进行了以下几个方面的研究工作:(1)提出了两个快速的非负矩阵分解算法。本文首先提出了一个基于Procrustes旋转的非负矩阵分解算法,该算法可以同时更新所有的因子矩阵。实验结果表明当数据的噪声比较小或者非负矩阵分解的秩比较低的时候,该算法不仅收敛速度快而且重构误差小。接着,本文进一步提出了一个混合的非负矩阵分解算法,该算法结合了上述算法与Zhou等人的非负矩阵分解算法,实现两者间的优势互补。实验结果表明混合的非负矩阵分解算法不仅收敛速度快而且能很好地对抗噪声的影响。(2)提出了一个基于外推法的快速对称非负矩阵分解算法。在充分研究He等人的乘性更新算法之后,本文采用外推法改善其收敛速度,并利用重启技巧保证目标函数在迭代过程中单调下降。实验结果显示改善后的算法比原来的算法在速度方面提升了 4倍以上。(3)将上述混合的非负矩阵分解算法推广到非负Tucker分解(非负张量分解中的一类),得到一个新的非负Tucker分解算法。本文在多个真实数据集上进行实验,实验结果表明相比于使用相同求解框架的其他算法,新的算法运行时间更少。(4)针对三阶的对称非负张量分解问题提出了两个乘性更新算法。本文首先利用辅助函数得到三阶对称非负张量分解问题的一个乘性更新算法,并证明当给定的张量满足一定条件时,该算法收敛到对称非负张量分解问题的一个稳定点。在此基础上,本文提出了一个混合的乘性更新算法,该算法结合了两个不同的乘性更新规则。实验结果显示相比于最近的对称非负张量分解算法,新提出的两个乘性更新算法在收敛速度方面都有所提升,特别是混合的乘性更新算法。(5)提出了一个新的非负二次规划算法,该算法不仅实现简单而且收敛快速。本文首先利用辅助函数和牛顿法得到一个非负二次规划算法,然后使用外推法改善其收敛速度。本文将新提出的算法应用于支持向量机模型训练中。实验结果显示新算法相比于 M3(Multiplicative Margin Maximization)算法和 SMO(Sequential Minimal Optimization)算法收敛速度更快。
其他文献
抗性为功能隐性遗传时,杂合子个体能够被高剂量表达Bt杀虫蛋白的转Bt作物毒杀,“高剂量/庇护所”策略能更有效发挥作用。另外,Bt抗性个体在庇护所区域的适合度是影响抗性发展
人体组织电特性在生物医学领域具有巨大的应用潜力。在电特性测量技术中,磁共振人体组织电特性断层成像(electric properties tomography,EPT)因其无创性、高分辨率、无需注
研究背景和目的宫腔粘连(IUA)是创伤、感染等因素引起的子宫内膜纤维化。主要病理改变是炎症及细胞外基质纤维蛋白原的聚集。宫腔粘连是世界难题,中重度IUA严重着影响患者的
设计能力不足已成为制约我国制造业转型升级的重要因素。现代设计以知识为基础,由于各种学习成长体系建设不完善、企业内部设计知识资源匮乏等现实问题,设计师不得不寻求外部
现代集约化奶牛场普遍采取产后母子立刻分离的饲养方式,这使得新生犊牛缺失了来自母牛的产后护理,比如舔舐、辅助站立和获得自然吮吸等。早期母子分离会对母牛和犊牛产生负面
表面涂层是提高材料防腐、减摩、耐磨性能的重要技术。单一成分或单一功能的涂层很难满足构建复杂工况下的性能需求。利用复合涂层中材料的多元性及结构上的多重性是使其与涂
葡萄霜霉病是影响葡萄产量和品质最为重要的病害之一。近年来,随着抗病葡萄的规模化种植及杀菌剂抗性群体的不断出现,霜霉病菌群体内发生了不同程度的遗传分化。研究前期发现
基于2D图像和3D点云数据的分析和理解是当前计算机视觉和机器人领域发展的主要方向之一,而2D-2D/3D视觉配准是视觉数据融合的基础。2D-2D/3D视觉配准通过对同一场景不同数据
社会治理是人类社会不可或缺的一项重要活动,是世界各国共同面临的一项重大课题。良好的社会治理是人类社会秩序井然、自由演进的根基,也是人类社会走向文明、和谐、繁荣和昌
自然资源与全要素生产率的关系是经济学界研究的热点,对这一问题的研究学术界存在着不同的观点。中国是世界上煤炭资源较丰富的国家之一,煤炭一直是中国的基础能源,煤炭的稳