【摘 要】
:
作为多义性数据的学习建模框架,多标记学习已成为机器学习领域一个新的研究热点。和传统的监督学习问题一样,数据样本中的随机性、模糊性和不一致性等多种不确定性因素也是多标
论文部分内容阅读
作为多义性数据的学习建模框架,多标记学习已成为机器学习领域一个新的研究热点。和传统的监督学习问题一样,数据样本中的随机性、模糊性和不一致性等多种不确定性因素也是多标记学习面临的主要困难。现有的多标记学习方法或者是通过问题转换方法“改造数据适应算法”,或者是通过算法适应方法“改造算法适应数据”,均是基于以统计学习为理论基础的学习算法。而统计学习理论关注的是数据的随机性,并不包含处理其他类型不确定性的理论机制。分析并处理多标记数据中存在的其他类型的不确定性,如模糊性和不一致性,目前在多标记学习中还鲜有涉及。 粗糙集理论模拟人类对于客观世界认知的不完备性,用精确的数学工具刻画数据中存在的不一致性,被认为是一种客观地处理数据不一致性的数学工具。本文分析多标记数据中客观存在的不一致性,发展了面向多标记数据建模、分析与计算的粗糙集理论与算法。所获研究成果既丰富了多标记数据分析的技术手段,又丰富了粗糙集理论的数据适用范围,对数据挖掘和知识发现具有重要的理论意义和应用价值。主要研究成果包括: (1)在粗糙集框架下,深入分析了多标记数据的标记不确定性,提出了多标记粗糙算子,进而建立了多标记粗糙集模型;进一步研究了多标记粗糙算子的数学性质,从而揭示了其粒化近似的本质特征;并研究了多标记粗糙算子与经典粗糙算子的关系,证明了多标记粗糙算子是经典粗糙算子的泛化;此外考虑数据的噪音,建立了变精度多标记粗糙集模型。 (2)定量分析了多标记粗糙集模型和变精度多标记粗糙集模型的标记近似粗糙性,提出了标记精度、标记粗糙度、标记质量、标记近似精度、标记近似质量、标记依赖度等多种不确定性度量;分析了包含度与提出的各种度量之间的关系,证明了多标记粗糙集数据分析的有关度量可归结为包含度。 (3)基于多标记粗糙集模型的粒化近似机制,提出了保持标记不确定性不变的多标记属性约简方法,即互补决策约简;分析了互补决策约简和两种代表性属性约简之间的关系,从而揭示了互补决策约简在处理多标记数据方面的优势;提出了基于区分矩阵的互补决策约简的计算方法,进一步指明了互补决策约简的结构和原理。 (4)基于多标记粗糙集模型的不确定性度量等价表示了互补决策约简,从而明确了计算互补决策约简的启发式信息;进一步设计了互补决策约简的启发式算法,并应用该算法对多标记数据进行特征选择;实验表明基于粗糙集理论的互补决策约简算法能够有效地删除冗余属性,提高多标记学习算法的性能。
其他文献
电力生产数据具有数据规模庞大、更新频率高、增长速度快的特点,对电力生产数据进行处理和分析并实现故障诊断具有重要的研究意义。在此背景下,本文以某电力实验研究院的项目为依托,在分析国内外研究的基础上,以云计算技术与关联规则挖掘为核心技术,设计并研发出一套可实现高度信息化与智能化的电厂故障诊断管理系统。本文采用Hadoop分布式架构设计并实现了电力私有云计算集群的搭建,通过MapReduce计算框架与H
并联机器人以其刚度大、结构紧凑、承载能力强、结构抗震性好和运动惯量小等优点,在应用上与串联机器人形成互补,扩大了机器人的应用领域。目前,并联机器人在机构学、运动学
轮胎气压是关系汽车行驶安全和性能的重要因素。汽车在高速行驶的过程中,胎压异常不仅对轮胎的寿命和燃油的经济性有影响,而且常极其容易引起爆胎,是所有国家道路交通中的一
电动汽车的电力驱动系统主要由电动机系统与机械传动系统所构成,是电动汽车的核心部分。研究表明,汽车的驱动电机和机械传动装置在运行的过程中会产生混沌现象,这给汽车带来影响车辆寿命、增加行车的安全性等非常不利的影响,因此需要对其混沌现象的产生机理,特征辨识以及抑制方法进行研究。驱动电机是汽车的动力来源,对其混沌特性进行研究是对车辆系统耦合混沌特性进行研究的基础。研究电机混沌产生的条件有助于使电机在运行过
基于IEC61850的数字化变电站发展情况,数字化变电站系统的配置管理对变电站的安全、稳定运行非常重要。配置过程中包括设备配置器和系统配置器两种配置工具,系统配置器负责对各
三维重建是计算机视觉技术的主要内容之一,它通过二维场景图像来恢复场景的立体信息。基于序列图像的三维重建技术是计算机视觉和计算机图形学技术相结合而产生的一门新技术,可
在企业的生产中,电网谐波污染严重,电能质量差,对企业生产效率以及生产安全造成很大影响。进行谐波治理,对提升企业生产效率,增加企业经济效益,具有很强的实际意义。本文在2015年武汉市科技支撑计划项目(2015010101010013)资助下,针对电网动态谐波治理功能需求,研究一种谐波滤波装置BP神经网络控制方法。采用该方法的谐波滤波装置能够对电网进行谐波滤除,实现电网智能动态谐波治理。本文完成的主要
钢铁行业是国民经济的支柱产业,高炉炼铁过程是钢铁冶炼中的一个重要过程。高炉炼铁是在一个密闭的环境中进行的,发生的物理化学反应复杂,波动性大,一旦发生事故,将造成巨大的经济
随着社会发展,清洁的可再生能源如风能的大力发展对缓解能源危机具有十分重要的意义,风力发电机组控制系统是机组组成的核心部件,其控制技术代表着发电机组的性能品质。本文的研究对象为国产的1.5MW风电机组,对其风力发电低风速下最佳功率控制和高风速下最佳功率控制做了深入分析,并在MATLAB下进行了仿真和分析。本文以研究风速模型和空气动力学基础理论为起点,分析风电机组不同风速下的工作状态,介绍风机的原理和