基于张量数据的分类方法与应用

被引量 : 0次 | 上传用户:A578964735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习中数据的表示形式非常重要。目前在处理张量型数据时,通常将其转化为向量型数据,这样就会丢失大量的张量结构信息。张量型数据能保留这些结构信息,因而更符合实际情况,基于张量数据的机器学习新方法开始被广泛研究及应用,己成为当今数据挖掘领域的一个新的研究方向,它的理论研究和实际应用正在快速的发展,最优化方法是其主要工具之一。本文以基于向量数据的机器学习方法为基础,从最优化角度研究张量数据的学习问题,特别关注张量数据学习问题的新模型的建立及其最优化算法的设计。本文的研究内容包括以下几个方面:1、通过对现有模型的分析,确定张量学习方法与向量学习方法的关系,进而从几何角度对支持张量机进行了解释。讨论了支持张量机权重张量的特有形式,得到了保持张量结构信息的几种方法,并在此基础上建立了张量学习的新模型--秩约束支持张量机。数值实验表明,这种方法不但能得到理想的分类效果,而且还避免了交替迭代,节约了大量的计算时间。2、为了保持张量的向量因子的相关性,构造了一种新的张量核函数,这种张量核函数能有效地保持张量的结构信息。通过将这种核函数与支持张量机的对偶问题相结合,得到了一种新的处理张量数据的非线性分类方法--加核支持张量机。3、由于欧氏距离是基于正交假设的,因此用欧氏距离来度量矩阵数据间的距离并不是很合理。通过引入矩阵的数量因子的位置关系,得到了一种新的矩阵距离。这种新矩阵距离不但考虑了矩阵数量因子的关系,还能够合理的度量矩阵数据间的距离。这种新矩阵距离可以应用到矩阵分类、降维、回归和聚类等多个领域。4、基于矩阵的新距离和多线性子空间判别分析方法,我们提出了一种新的矩阵降维方法。通过引入反映矩阵稀疏性的L2,1范数,建立了带有稀疏性的支持张量机模型,这种方法不但能实现对数据的降维,还能够实现对数据类别的预测。通过大量的数值实验表明,这两种降维方法具有可行性和有效性。5、通过对基于张量的机器学习方法的全面总结,我们提出了基于张量的机器学习方法的框架。框架指出研究基于张量的机器学习方法实质上就是在寻找一个理想的张量距离度量。
其他文献
以英语测试与评估理论为依据,讨论地方性高校英语专业现行的终结性评价机制存在的问题。在此基础上,论证构建英语专业教学形成性评估体系的必要性,旨在为外语测试的改革和人
英汉词汇的外层由明示的词音、词义等组成,直接参与交际活动,属于语言界;中层由意念的理据构成,管约着词语创制行为,属于认知界;里层由经验的社会因素聚成,是词汇和其理据生
给材料作文命题形式重现高考试卷,由于近年来对命题作文疏于训练。很多考生不知所措,针对这一现状,本文强调审题立意"四忌":忌根据材料部分内容立意、忌在非主要信息上立意、
随着信息化时代的到来和网络的发展,人们对信息的需求已由原来的被动接受阶段过渡到了主动提取阶段,上市公司做为信息提供主体和信息需求主体,一方面希望能及时、准确的对外
就海外的汉学研究而言,俄国一直是该领域的研究大国,也是最早开始中国现代文学研究的国家之一。费德林是苏联时期著名的中国学专家,其研究兴趣广泛,在中国文学研究领域成果尤
便携式发电机作为一种新颖的离网供电设备,以其独特的“交流-直流-交流”的供电方式而具备噪音低、污染小、原动机转速根据负载大小可调节等优势,在应急通讯、野外医疗等方面具
探讨宽波束天线噪声温度的计算方法及噪声温度对系统灵敏度的影响 ;提出天线自身噪声源、天线自身噪声温度、天线直流电阻、天线交流阻抗等概念 ,给出自身噪声温度的计算公式
群众路线是中国共产党的优良传统和政治优势,是中国共产党行之有效的根本工作路线和组织路线。正因为始终坚持贯彻群众路线,中国共产党才克服了千难万险,在革命、建设和改革中取
<正>《自信心量表》由美国心理学家罗森伯格制订,它是世界上最常用的测量个人自信心的量表。它共有10个测题,用以测量个人对自我感觉的好坏程度。以下是一组有关自我感觉的句
企业的可持续发展问题是国家、社会可持续发展的基础。当今企业所面临的,不仅是激烈的市场竞争,而且是消费者、社会公众不断上升的权利意识,还有社会、政府、媒体对于环境保