基于张量数据的特征提取和分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:dishunzhaopin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式传感、计算技术的进步以及物联网(Io T)的发展创造了时空数据丰富的环境,大量复杂的数据被采集。在现代工业系统中,常常会安装多个传感器(空间索引)采集大量非线性波形信号数据(时间索引)。近些年来,相比较传统的信号处理方法,基于统计分析、机器学习的方法也被用来分析信号数据,例如主成分分析(PCA)、支持向量机(SVM)等。但是当涉及到多个传感信号时,这些方法并不能直接应用。多个传感器采集的数据也被称为多通道数据,数学上可以用张量来表达,对其建模的过程和分析变得更加复杂,因为需要考虑不同传感器通道之间的相互关系。一方面,多通道数据在时间、空间表现出变异和交叉相关性,这有利于挖掘数据内在的联系,设计更有效的系统并做出更好的决策。另一方面,由于数据的高维度、异质性和复杂的互相关性,张量数据的建模和分析已成为相当大的挑战。本文针对多通道数据的特征提取,过程监控和异常检测,提出了新的方法来对张量数据进行建模和分析。本文的主要工作如下:1.基于不相关多重线性主成分分析以表征多通道数据的相关性和变异在一些多传感器数据融合的研究中,每个样本中的各传感器采集一个数据点(标量),则S个传感器采集了S个标量值,其可以表达为一个×的矩阵(M是样本数)。但在本文中,每个样本中的各传感器采集N个数据点(向量),则S个传感器采集了S个向量数据,其可以表达为一个××的张量。在该情况下,类似PCA的向量型方法不能应用。为了解决该问题,需要开发一个能保持张量数据结构并考虑通道间相互关系的方法。本研究开发了一种基于多重线性的PCA——不相关多重线性主成分分析(UMPCA:Uncorrelated Multilinear Principal Component Analysis)来解决这个问题,基于PCA的原因主要有三点:(1)相比一些机器学习方法(如神经网络),PCA包含变量的线性变换,具有更好的可解释性;(2)PCA可以通过解释不同变量的相关性来分析异质数据;(3)现已有很多研究应用PCA分析工业数据,但基于高阶拓展的PCA分析多通道数据的相关研究很少。相比较直接向量化的方法,UMPCA可以在不破坏张量数据结构的基础上,直接作用于张量数据。通过“张量——向量”的投影,将张量数据映射到低维的向量空间,以投影后的特征方差最大为目标,基线性无关为约束,利用启发式迭代求解一组初级多线性投影向量集,并重构为一组特征张量来表征通道间的相关性和变异。本研究的主要目标是提出一种基于UMPCA的方法来分析多通道数据并提取一组特征张量。蒙特卡洛模拟和真实案例研究的结果表明,提取出的特征张量能精确地表征各通道之间的相关性和变异大小。2.一种新的基于张量特征提取的过程监控方法前一部分研究重在多通道张量数据知识的提取,以发现工业系统内在的联系并对系统性能进行推断。在第二部分研究内容中,进一步考虑了如何监控多通道数据。多通道数据采样于一个高维的张量空间中,其复杂性和高维度使得数据本身难以被监控。因此,需要开发一种特征提取方法,可以有效地从高维张量数据里提取潜在的低维特征以用于过程监控。近些年来,有学者提出了多重线性主成分分析(MPCA),在张量各阶下寻求一组能最大化方差的投影矩阵。在应用MPCA后,可以提取低维的核心张量。但是,基于PCA方法的局限性在于这些方法没有充分利用数据的类别标签。另外,由于很多过程监控的控制图是为标量或者向量设计的,因此还是无法监控提取出的核心张量特征。线性判别分析(LDA)是一种有监督的特征提取方法,基于线性的LDA不能直接应用于张量数据,此时也可以进行张量数据向量化,但是同理,这种方法没有充分利用到多通道数据的丰富信息。本研究提出了一种新的特征提取方法以监控多通道数据。首先应用MPCA从输入的高维多通道数据中提取核心张量,然后逐个展开该张量的各阶,将张量的各纤重新排列成一个二阶矩阵。得到的数据维数可能很高,而在工业实际应用中,训练的样本数通常比较少而无法代表其类别的真实特征。因此,不少学者采用了正则化方法,通过加上1、2范数来解决分解矩阵奇异性问题。当获得二阶特征矩阵时,相比较一般的正则化方法,本研究根据数据类别的可区分性提出了一种特征选择策略,选择出能最大化类间方差和类内方差比的特征,最后再结合LDA进一步提取出低维特征。本研究首先提出了一种新的结合多重线性和线性、具有特征选择策略的特征提取方法,以提高多通道数据的可分离性,最后融合了多元控制图以进行过程的监控。蒙特卡洛模拟和真实案例研究的结果表明,相比较其他方法,所提出的方法能检测出更多的异常值。3.一种基于改进的不相关多重线性判别分析的故障诊断方法上一研究结合了基于线性LDA的特征提取方法以实时监控张量数据,该方法最后提取的特征数受限于样本的类别数。在本研究中,进一步深入研究基于多重线性的LDA提取更多的特征以用于工业系统中张量数据的故障分类和诊断。在模式识别中,有学者提出了一种不相关多重线性判别分析方法(UMLDA:Uncorrelated Multilinear Discriminant Analysis)以用于人脸识别和图像处理。与非监督的UMPCA相比,UMLDA是一种有监督的多重线性特征提取方法,在提取特征时会考虑样本的类别信息,因此更适合模式的识别。尽管UMLDA在人脸识别和图像处理中有了一些探索性的研究,但是未有相关研究应用UMLDA算法分析多通道数据以进行工业系统的故障诊断。本研究第一次应用UMLDA分析多通道张量数据以显示其在故障诊断中的优越性。但是,UMDLA算法有两个局限性:(1)初始化:由于UMLDA在求解上没有解析解,因此采用启发式算法迭代求解投影向量。但是,应该如何初始化初级多线性投影向量集?(2)投影顺序:当在一种张量模下计算投影向量时,需要固定张量的其他模。求解模的顺序也影响最终的识别正确率。为了解决第一个问题,有研究提出了Regularized-UMLDAAggregation(R-UMLDA-A)来聚合不同的初始化方法,以减少初始化的影响。然而,针对第二个问题,无论从算法还是数据的角度仍无法确定最佳投影顺序,这仍是一个开放性的研究问题。本研究提出了一种改进的基于张量到张量全映射投影的UMLDA(IUMLDA)方法,数据信息在张量各阶上按照重要性依次排列,以削弱投影顺序的影响,从而提高识别的准确率。然后基于“张量——向量”的投影,以基线性无关为约束,采用启发式迭代求解一组能最大化费舍尔判别标准的初级多线性投影向量集。蒙特卡洛模拟和真实案例研究的结果表明,相比较其他方法,所提出的方法在不同故障的分类中有更高的识别准确率并能减少正确率的波动。本文提出的所有方法都通过蒙特卡洛模拟和真实的案例数据测试,以论述所提方法的有效性。另外,所提出的方法具有通用性,可以应用于具有数据采集和分析的系统中。部分研究成果已在实际的工业系统中应用,并取得了一定的实际价值和经济效益。
其他文献
自主定位导航作为移动机器人的关键技术之一,是赋予机器人移动感知和行动能力的重要因素。其中,定位模型和导航算法是机器人自主定位导航技术的核心。目前,室内定位模型大多存在成本高、有效性差等问题,限制了移动机器人的应用场景。常用的导航算法容易发生“维数灾”现象且无法处理非线性约束问题,难以保证机器人导航的实时性和可靠性。基于以上现状,本课题采用QR二维码作为位置标识信息载体,并在此基础上结合机器视觉与路
滚珠丝杠进给系统作为机床中的关键部件,深刻影响着机床加工工件的精度。滚珠丝杠进给系统是一个复杂的机电系统,其中存在各种干扰误差来源。本文分析了滚珠丝杠进给系统的动态特性,考虑了其中存在的干扰和时变不确定因素,建立了能够反映其实际动态变化的参数不确定模型。基于滚珠丝杠进给系统的参数不确定模型,运用先进控制理论的方法,设计了几种控制器,能够减小未知干扰和动态变化带来的影响,提高运动精度。使用设计的控制
随着科技、经济的发展,按摩椅已经逐步走进人们的日常生活中。目前市面上的按摩椅机芯通过机构实现按摩手法,这种方法只能实现单一的按摩手法轨迹。而新型的按摩椅机芯能够包含三个独立自由度,理论上能够实现空间内任意按摩手法轨迹,动作更加灵活,但是控制方式上更加复杂,需要专门设计控制系统。此外,目前评价按摩椅效果的方法主要是依靠少数使用者的主观评价,缺乏客观性。因此,有必要建立能够客观评价按摩效果的评价系统。
片上温度传感器对于超大规模集成电路的温度管理系统尤为重要。与传统的基于电压域的温度传感器相比,基于时间域的温度传感器更适于作为片上温度传感器。但由于电压对晶体管传输特性的影响很大,现有的时域温度传感器在宽电压范围内不能有效降低电压变动带来的误差。而Io T对于低功耗的需求极为强烈,工作电压的降低可以有效减少芯片的整体功耗。因此,设计研究可在宽电压下工作的时域温度传感器非常迫切。本文首先分别从架构级
Mecanum轮全向移动机器人能够在狭窄的空间里进行平面上任意方向上的移动,并且可以实现零转弯半径的旋转运动。同时,Mecanum轮控制方便,获得了众多研究人员的青睐。Mecanum移动机器人在中低速场景下,可以拥有较好的运动特性和控制精度。为了发挥Mecanum轮全向移动机器人机动性强的优势,本课题以打羽毛球为应用场景,对高速Mecanum轮移动机器人进行研究。首先,本文分析对比了多种全方位移动
类人机器人是集机械工程、电子工程、计算机科学、自动控制技术于一体的多学科交叉的产物,是机器人领域的一个重要研究方向。本文根据2019年的Robo Cup小型类人足球机器人比赛规则,设计制作了机器人物理样机,完成了其控制系统的搭建,使得机器人具备一定的行动能力和感知能力去完成足球比赛。本文首先对机器人的机械结构及硬件设备进行了设计和选型,机器人包含18个自由度,利用总线式数字舵机作为关节执行器,通过
纺纱行业是我国支柱性经济产业之一,自动化、智能化是纺纱行业未来的必然发展方向。筒子纱打包对纱线生产的效率有着至关重要的影响,本文以全自动筒子纱打包机为研究对象,围绕筒子纱自动配重、种类识别、热熔塑封及装袋打包等关键技术展开理论和试验研究,论文的主要工作和创新点如下:确定全自动筒子纱打包机的功能需求,并进行模块划分。在分析筒子纱打包的基本要求和工艺流程的基础上,确定全自动筒子纱打包机的功能;将设备划
穿戴式下肢外骨骼机器人是一种典型的人机耦合系统,需要外骨骼与人体运动状态协调,进而辅助人体运动,提高人体的运动机能。本文针对复式套索传动的下肢外骨骼,研究其轨迹跟随控制技术,以辅助患者进行康复训练;设计人机协同控制系统,控制外骨骼对人体进行助力,提高人体的运动机能。首先,本文对复式套索传动特性进行分析,建立复式套索传动模型;对所研究的下肢外骨骼结构进行分析和简化,根据拉格朗日方程,建立人体下肢的动
机床是包含多个支承件和结合面的设备,其内部的刚度、阻尼、质量共同组成了复杂的系统,研究不同零部件之间的静、动刚度匹配关系,可以为机床结构的设计和改进提供指导。本文以平床身卧式车床为研究对象,以子结构模态综合法为理论基础,结合模态试验和有限元仿真,对该车床进行动态特性分析和理论建模,并提出针对机床结构的刚度匹配设计方法。论文主要工作内容如下:(1)基于模态试验的车床结合面切向刚度估算方法根据车床在实
随着我国经济条件的提升,驾驶员数量的增加,驾驶风格也走向了多样化,暗示着道路上将因为各类驾驶员不同的驾驶风格和驾驶技能造成的交通事故越来越频繁。针对这类问题,各大车企与高校争相研究汽车辅助功能与一系列汽车先进智能化技术。汽车智能辅助驾驶系统,一方面可以很好的减轻驾驶员的疲劳状态,另一方面还可以在普通城市工况或者高速公路工况下最大限度地保证车辆行驶安全,成为通向现在热度最高的无人驾驶和智能交通技术的