图约束非负张量列分解算法及其在特征提取中的应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:wain155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的飞速发展,现实生活中的许多数据呈现出高数据量和高维度的特点。由于这些现实数据含有特定的物理意义,通常都具有非负性,被统称为非负张量数据。现实的非负张量数据经常呈现“高维,大规模和异构”等形态,其有价值的信息蕴含在复杂的潜在结构中,随着数据规模的不断增大,数据分析所需的存储和计算成本也相应增加。此外,流形学习技术指出,观测到的数据实际上是通过内在流形结构映射到高维空间的。但现有的经典非负张量分解技术在挖掘数据的潜在信息时,很难捕获到这种内在流形结构。因此,如何快速且有效地处理非负张量数据,捕获数据内在流形结构并提取更多具有表征意义的低维特征,是特征提取领域一个重要的研究课题。近年来,非负张量列分解(Nonnegative Tensor Train Decomposition,NTT)由于能从一定程度上避免维度灾难,并保留非负张量数据的高维结构信息,因而受到了学者们的关注。本文主要研究非负张量列分解模型,通过近邻图编码数据的内在流形结构,并建立了可以捕获数据内在流形结构的非负张量列分解模型,设计了两种相关的优化方法来求解模型,最后通过实验验证了理论的有效性和正确性。针对传统非负张量列分解模型无法捕获数据内在流形结构的问题,本文通过构造近邻图来刻画非负张量数据的内在流形结构,在NTT分解的基础上嵌入由近邻图构成的图约束项,提出了一种图约束非负张量列分解(Graph Regularized Nonnegative Tensor Train Decomposition,GNTT)模型。GNTT模型不仅能保留NTT模型的优点,还能额外捕获非负张量数据的流形结构,从而具备了学习更多可辨识信息的能力。针对GNTT模型的优化问题,本文定义了求解GNTT模型的代价函数,并详细推导了基于乘数更新法(Multiplicative Updating Method,MU)的更新规则,从而提出了GNTT-MU算法。GNTT-MU算法具有原理简单、易于实现的特点。实验结果表明,GNTT-MU算法提取的特征能够很好地表征原始数据。在三个非负张量数据集上,其聚类和分类性能量化指标均领先于同类型算法。同时,实验结果还验证了GNTT-MU算法对超参数不敏感,较为简单实用,而且GNTT-MU算法能收敛到一个平稳点。但在处理大规模问题时,GNTT-MU算法的优化效率较低。针对GNTT-MU算法优化效率较低的问题,本文证明了GNTT模型的代价函数关于目标变量的导数是满足Lipschitz连续性的,并推导了基于加速近端梯度法(Accelerated Proximal Gradient Method,APG)的更新公式,从而提出了高效的GNTTAPG算法。实验结果表明,在五个非负张量数据集上,GNTT-APG算法的聚类和分类性能量化指标均与GNTT-MU算法较为接近,但在相同任务上,GNTT-APG算法所花费的运行时间比GNTT-MU算法更少。同时,实验结果还验证了GNTT-APG算法对超参数不敏感,而且能够快速地收敛,也证明了该算法的实用性。本文还设置了一个针对高阶非负张量数据集的实验,结果表明随着张量阶数的增加,GNTT-APG算法仍然能保持其高效性。
其他文献
近年来,近视已经成为影响当代儿童身体健康最严重的眼科疾病,我国儿童近视率已经高达百分之四十,随着年龄的增长,比例还在不断的扩大。儿童近视之后不仅会影响日常的学习,如果不加以防治,还有可能导致眼睛出现病理性病变,更严重还会导致永久性失明。目前众多科研人员对于导致儿童近视的原因进行了深入的研究,发现不良用眼习惯是导致儿童后天近视的主要原因,如果能够采用监测设备对于儿童日常学习时的不良姿态做出监测和提醒
学位
学位
学位
依托第五代移动通信网络的应用部署和物联网的快速发展,大量低功耗设备的应用越发广泛,从而使无线携能通信技术越来越受到关注。无线携能通信技术可以利用同一个频段,同时对能量接收机和信息接收机进行能量和信息传输,在保证通信质量的同时解决低功耗设备的能源问题。但是,由于使用的无线频段越来越高,无线信号会因距离或者障碍物等因素限制信号的覆盖范围。另外,在物联网应用中,系统中的信息接收机往往较密集,严重的信号干
移动机器人作为当前科技领域的集大成者,集成了电子信息、计算机科学等多个学科的高精尖技术,其软件系统由感知系统、决策与规划系统、控制系统等多个模块组成,关键技术的重点难点之一就是决策与规划。本文首先介绍了一种结合端到端路径规划技术的自主建图方法,并对其中采用的端到端路径规划算法进行了改进,最后通过仿真实验验证其可行性。针对项目要求的清洁机器人,本文提出一种基于回溯法的双向完全遍历路径规划方法,对工作
现有制造车间的大型设备复杂度高,越来越依赖监控系统对其进行实时性管理。而伴随着车间智能终端设备的迅速增加,目前依靠云计算的设备监控系统所需传输的数据量越来越大,车间需要紧急响应的告警信息容易出现延迟,导致设备不能正常运行,严重会造成设备停机等问题,进而影响车间生产线的生产效率。因此,加入边缘计算模型的云边协同数据处理方式逐渐得到重视。当前基于云计算的智能车间设备监控通常把监控数据全部传输到云端进行
超分辨技术是计算机视觉等领域的重要与热门研究方向,在医疗成像等众多领域有广泛的应用。基于深度学习的超分辨重建技术在近几年中发展迅速,神经网络模型对高分辨图像的重构性能越来越强,充分体现了使用深度学习解决超分辨任务的优势。但基于深度学习的超分辨重建技术在提升系统性能时很多是依靠堆叠大量神经网络和设计各种复杂的网络来实现的。同时训练后得到的部署模型存在推理时间长、参数量多等问题。这导致了设计的许多神经
深度预测和相机姿态估计一直以来是计算机视觉领域重要的研究方向之一,是指计算机通过二维图像估计出场景的深度信息和相机姿态信息,广泛应用于自动驾驶、服务型机器人和无人机等人工智能领域。传统基于几何的深度预测方法和相机姿态估计方法虽然在一定程度上能得到场景的深度信息和相机的姿态信息,但是存在计算过程复杂、场景适应性差等问题。目前,基于深度学习的深度预测和相机姿态估计方法一般以卷积神经网络和循环神经网络为
受脑科学、神经计算科学研究的启发,脉冲神经网络作为模仿生物大脑机理的计算模型,在仿生视觉、嗅觉、记忆等应用场景中暂露头角,并逐渐成为脑模型研究的主流。脑科学研究表明,生物大脑的神经元突触个数比其神经元数量大3-4个数量级,生物大脑每周期的生物实时处理时间大概为1-10 ms,大脑工作过程伴随着大量脉冲信号的传递。因此,脑模型的生物实时仿真可抽象为超大规模的图计算和海量微小脉冲包的通信问题,给传统冯