【摘 要】
:
分类是将给定的数据划分到预定义的数据类中的过程,在数据挖掘和机器学习中是非常重要的一个学科分支并有着广泛的应用和研究。根据数据属于单个类还是多个类,分类分为单标签
论文部分内容阅读
分类是将给定的数据划分到预定义的数据类中的过程,在数据挖掘和机器学习中是非常重要的一个学科分支并有着广泛的应用和研究。根据数据属于单个类还是多个类,分类分为单标签分类和多标签分类,由于多标签能更加真实的表达现实世界中的存在,其应用相对单标签而言更加广泛。目前多标签分类比较多的应用在文本分类,生物信息分类,场景分类,图像自动标注,视频剪辑等众多领域。虽然多标签应用广泛,但由于多标签内在的复杂性即标签之间存在相关性和多标签数据表达的复杂性以及输出空间的指数性,仍然需要对现有的理论和算法有进一步的研究和整合,以使多标签分类算法有进一步的改善。1、相关理论分析。首先简要介绍了单标签的相关理论;然后对多标签分类的相关理论和方法进行了详尽的阐述和分析。2、基于MLKNN(Multi-Label K-Nearest Neighbor,多标签k邻近算法)。KNN(K-Nearest Neighbor,k邻近)算法是一种简单但高效的聚类算法,有着广泛的应用,在多标签分类中也得到了一定程度的应用。在分析多标签分类算法MLKNN存在缺陷和不足的基础上,本文提出一种改进的MLKNN算法。对于每一个输入数据,利用KNN算法得出输入数据的k邻域进而求得每个数据中每个标签的先验概率和后验概率,然后得出每一个标签在数据中的最大概率。将每个数据的各个标签概率放到数据的特征向量中并以此来表示局部的标签相关性,再用带有标签概率的数据特征训练分类模型。对比实验结果验证了所提算法具有较好的多标签分类效果。3、多实例数据表示分类方法。现存的很多分类方法都只是将数据样本表示为一个实例训练分类模型进而得出未分类数据的标签,没有利用数据本身所包含的丰富的信息,鉴于此在KNN的框架下,本文提出一种基于多实例数据表示的多标签分类方法。该算法首先对于每一个输入数据,利用KNN算法得到该输入数据的k邻域,对于每一个标签,k邻域中包含该标签的所有数据的算术平均值作为对应标签的原型向量。将输入数据与该数据对应的每一个原型向量的差值作为对应标签的实例,这样原始数据将有多个实例表示,从而得到新的训练集数据。用新的训练集数据训练分类模型。对比实验结果证明了所提算法的有效性。
其他文献
末端区域能量管理(TAEM)段是重复使用运载器(RLV)再入返回过程中的关键阶段,其主要目的是控制飞行器的能量,使飞行器能够顺利到达着陆窗口。为了适应不同初始能量状态,本文开展
循环流化床锅炉具有燃料适应性广、燃烧效率高、低氮氧化物生成量等优点,而被广泛的应用。然而循环流化床锅炉是一个控制特性复杂、多输入输出、大延迟的系统,难以建立精确的数
计算机和网络等信息技术的日益革新,促进了视频监控技术数字化、网络化和智能化的发展。运用计算机视觉理论的视频内容分析技术,能够对监控场景中的目标进行识别和行为的检测,具
钕铁硼氢粉碎是永磁材料生产工艺中常用的制粉方法,由于钕铁硼氢粉碎过程中被粉碎合金的粉碎状态、合金中氢含量等生产运行数据无法在线检测,导致钕铁硼氢粉碎工艺难以实现高水平自动控制。操作工人只能靠经验判断,以延长合金吸氢时间来保证合金完全粉碎,造成生产周期延长,浪费资源,生产成本加大。合金吸氢反应过程状态未知,难以调整最优控制参数,会影响合金粉末的品质。为了保证产品质量及生产效益,需要对钕铁硼氢粉碎控制
在现代社会,自动化生产技术已广泛渗透到各行各业之中。而精确高效的生产制造技术离不开相应精度的测量技术,当前此两者的之间的矛盾越来越突出。以计算机视觉为理论基础的自
高速动车组制动系统是动车组的重要组成部分,也是列车得以安全运行的保障。随着我国和谐系列(CRH)动车组的迅速发展,对列车的制动系统也提出了更高的要求。目前,列车制动主要
随着无人机军事价值的日益凸显,未来战场上无人机将是主力军之一,其面临的飞行环境将越来越复杂,无人机在线实时航迹规划技术将成为必然的发展趋势。本文针对无人机巡航阶段实时
21世纪是一个以网络为媒介的信息交互时代,网络深刻地影响科学技术的发展。时钟同步是网络化系统中的一个经典论题,伴随着现代工业现场网络系统复杂程度、结构规模、业务量的不
高速动车组作为一种新型的交通运输方式,给人们出行带来了很多便利。近年来,我国的高铁行业得到迅速的发展,高铁运营总里程已经突破2万公里,高速动车组运行速度也达到300km/h
近年来,伺服驱动技术在各种新理论、新技术的推动下发展迅速,在数控机床、航天技术、高精密仪器等各领域得到了广泛的应用。但我国自主研发的产品无论是性能还是稳定性都和国外产品存在一定的差距。论文以五轴精密试验台为背景,在永磁同步电机控制理论的基础上,构建了控制系统结构,以混沌粒子群算法为控制系统PI优化算法,对主轴电机控制系统的PI参数优化进行了研究。首先,建立了永磁同步电机在两相旋转坐标系下的数学模型