标签语义空间挖掘的缺省多标签学习

来源 :安庆师范大学 | 被引量 : 0次 | 上传用户:Tiramisu_smile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标签学习中,每个实例对应多个标签并拥有丰富的语义信息。不可否认的是,标签的缺省现象经常发生在多标签数据集。缺省标签会导致多标签学习算法获取错误的语义信息或者丢失重要的语义信息。标签空间的挖掘工作是多标签学习中研究热点,获取的语义信息可以提升算法的性能。因此,标签空间的挖掘方法及度量信息的方式是研究重点。基于此,本文研究工作如下:1)在多标签算法中,大多利用特征与标签嵌入等方法挖掘标签空间的语义信息。但是,这类方法未利用特征与标签间可能存在的某种联系。类属属性的提出较好地诠释特征与标签的联系,即标签可能对应一组自身的特征。然而,这类方法未能给出特征与标签间可能存在逻辑关系,标签与实例是否存在同样的逻辑关系。因此,本文提出基于PLSA(Probabilistic Latent Semantic Analysis)学习概率分布语义信息的新型多标签分类算法(Multi-label classification algorithm based on PLSA learning probability distribution semantic information,PLSA-ML)。2)目前,大部分算法结合标签相关性及类属属性来提升多标签学习效果,但没有考虑数据集中标签缺省的影响。实际上,通过标签补全的方法能进一步丰富标签矩阵的信息,进而联合类属属性的联合学习框架使得多标签学习能有效提升算法的鲁棒性。基于此,本文提出一种联合标签补全和类属属性的多标签学习算法(Joint Label Completion and Label-specific Features for Multi-Label learning algorithm,JLCLS)。3)标签的缺省会导致标签嵌入模型捕获不完全的潜在语义信息。然而,基于标签相关性的恢复机制只考虑标签关联,而忽略了实例相关性信息的客观存在。本文采用两级标签恢复机制,不仅从标签的角度恢复标签数据,而且充分利用标签空间中的实例相关性。本文结合两级语义信息,提出了一种两级标签恢复机制的标签嵌入多标签分类方法(Two-level label recovery-based label embedding for multi-label classification with missing labels,LE-TLLR)。本文基于PLSA对类属属性与标签与实例关系进行合理的解释。通过构建标签补全与类属属性的联合学习框架解决缺省标签对类属属性提取的影响。对于获取缺省标签空间内在信息的问题,本文利用两级标签恢复机制与标签嵌入的方法。本文提出的算法与其他对比算法相比有较好的性能,并利用可视化分析与统计假设检验等进一步说明所提算法的合理性。
其他文献
本研究试通过排球专项体能训练影响小学生体质健康测试的成绩,以改变小学生身体形态,提高小学生身体机能,增强小学生身体素质,达到改善小学生体质健康水平的目的。进而探究排球专项体能训练在干预小学生体质健康水平方面存在哪些积极影响和不足之处,提出改进措施,并给予建设性的意见和建议。本研究以排球专项体能训练对小学生体质健康测试的影响为研究对象,通过文献资料法、专家访谈法、实验法、测量法、数理统计
徐訏执着距离情思的美学追求,常居于此地书写彼地,利用情感过滤的方式来刻意处理小说的背景,将故事引向别处,以产生和现世的疏离,超越时代,获得异乎寻常的美感,作品也相应具有更为普遍、永久的价值。
铝合金焊接起来难度大,尤其是电池外壳用薄板铝合金焊接难度更大。本文主要研究采用脉冲激光焊机对0.5毫米铝合金薄片焊接时,采用合适的焊接参数,焊前采用CCD监测焊缝间距,定位准确后再进行焊接,焊接过程中选用平均焊接速度≥20mm/s,能够获得焊接熔深0.4~0.7mm,熔宽0.8~1.2mm,并且焊缝成形美观的焊缝,无需打磨,简化生产工艺。
基于统计学理论的支持向量机(Support Vector Machine,SVM)是模式识别和机器学习领域重要的研究方法之一,它具有直观的几何解释和完美的数学形式,被广泛应用于图像分类、语音识别和生物信息等领域.随着研究的不断深入,受SVM思想的启发,Khemchandani等人于2007年提出了孪生支持向量机算法(Twin Support Vector Machine,TWSVM),该算法通过寻
在时代快速发展的今天,随着大数据和人工智能新兴产业的出现,需要社会培养出具有开拓精神和创新意识较高的人才。随着《高中数学课程标准(2017版)》的发布,数学建模作为六大核心素养之一,受到了社会广泛的关注,俨然已成新一轮高中课程中的新的主题。数学建模思想已被广泛地应用于数学课堂的教学中,成为数学学科学以致用的有效表现形式,而数学建模思想对于培养学生的创新思维能力、激发学生的创新意识都有着积极的促进作
本文选取了一个经典的模型——分数阶时滞神经网络系统.首先利用Holder不等式提出了一个关于上升函数的不等式.然后在阶数1<α<2的情况下,为了使得驱动系统与对应的响应系统能在有限时间内达到同步,我们先定义一个误差系统,继而通过利用Jensen不等式、广义Gronwall不等式和线性反馈控制器,建立了一个充分判据,确保这类分数阶时滞神经网络系统能实现有限时间同步.最后再利用Matlab演练,验证这
随着集成电路制造工艺的不断变化,以及对测试效率和可靠性的需求,为集成电路行业在测试方面带来了新的挑战,如何改善芯片在测试时的效果并且有限度地降低芯片生产中的测试成本成为集成电路产业中的重要环节。不断增加的测试数据量和不断提高的电路功能复杂度,使得测试温度以及功耗不断增加,由于温度过高而损坏芯片的风险也随之增加。随着测试数据的日益增多,对自动测试设备的存储能力、I/O通道数、频率等方面有了新的技术要
从20世纪50年代左右开始,集成电路出现并蓬勃的发展,随着科技的发展集成电路制造工艺也越来越精湛,集成电路的内部结构也越来越复杂。更先进的设计和工艺让芯片有着更强的计算能力的同时也给测试带来了新的挑战,大量的测试数据带来了更长的测试时间和更高昂的测试成本,于是提出了测试集的重排序测试方法。重排序的目的是将高价值的测试向量优先测试,在保证故障覆盖率的同时缩短了测试时间。论文的研究内容围绕测试集重排序
三角函数是我国中学数学课程中非常重要的内容之一,根据《普通高中数学课程标准》,三角函数被编排在新教材的必修4中,主要包含数学的数形合一、转化、化归、代换、特殊化等重要的数学思想,学生通过学习三角函数来培养“四基”和“四能”以及提升数学抽象、数学建模等等数学学科核心素养。基于十余年来的教学改革和研究,在中学数学三角函数中,已有众多教师学者在不同角度有着不同见解,但是并没有对三角函数的教学和解题作出系