基于关联规则的多标签分类研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:yuanhongsheng1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在图像分类及标注、文本及语音分类、基因功能分析等实际应用中,分类所面临的数据已呈现出多标签特性,多标签分类已成为分类研究中的一个重要研究方向。与单标签分类问题不同的是,多标签分类问题的目标是寻找与待测数据相联系的标签集或一组标签,而不是单一标签。长期以来,单标签分类问题得到了广泛而深入的研究,专家们提出了多种性能较好的分类算法,但是现有的面向单标签分类问题的算法并不能直接用来处理多标签的问题。因此,如何设计出有效的多标签分类算法已成为分类领域中的一个研究热点。   论文介绍了多标签分类问题的研究现状、相关技术,重点探讨了基于关联规则的多标签分类方法,并就多标签分类算法中所存在的一些不足,提出了相应的解决方案。另外,考虑到实际应用中最小支持度和训练样本数据库需要不断地被调整,提出了相应的增量式多标签分类算法。   论文的主要研究工作包括以下几个方面:   1、介绍了多标签分类问题的研究现状,阐述了基于关联规则的分类方法的研究进展。总结了分类、关联规则以及关联分类方法的基本思想和相关技术。   2、提出了一种基于关联规则的多标签分类方法MLCMBAR,该方法通过挖掘样本数据库中的频繁项目集来构造多标签精确关联分类规则,并就挖掘过程中出现的一些关键问题提出了相应的解决方案。实验结果表明,与现有的一些经典多标签分类算法相比,算法MLCMBAR具有良好的性能。   3、针对实际应用中相应参数需要不断被调整的情况,提出了一种增量式多标签关联分类算法MLIUAS。该算法能够充分利用旧支持度下的频繁项目集来高效生成新支持度下的所有频繁项目集,从而得到新支持度下的多标签精确关联分类规则。理论与实验结果表明,算法MLIUAS具有较好的性能。   4、针对实际应用中训练样本数据库需要不断更新的情况,提出了一种增量式的多标签关联分类算法MLIUD。该算法充分利用已有信息来发现最新训练数据库中的频繁多标签关联分类规则。理论与实验结果表明,该算法具有良好的性能。
其他文献
随着信息技术的普及和电子商务的不断发展,物流不但实现了由传统向现代的快速转型,更被提到了前所未有的高度,在经济发展中的重要作用和战略地位也越来越突出。将信息技术、
随着微机电系统、计算机技术和通信技术的快速发展,出现了一种新型的网络系统,即无线传感器网络。由于其具有单个节点成本低廉、功耗开销小以及节点布置方式简单等优势,在诸
是交通运输业的永恒主题。近年来,随着道路汽车数量的急速增长,交通事故的发生率也越来越高,给人类社会带来日益严重的的危害。在这严峻的环境下,疲劳驾驶检测技术受到了最为
分类所关心的一个根本问题是如何有效地提高分类系统的泛化能力。尽管传统的分类技术在一些领域己经得到了成功应用,其泛化能力也得到一定程度的认可,但是随着时代的进步和科
基于内容的图像检索技术涉及到计算机图像处理、计算机图像识别和图像数据库等领域。在数量巨大的数字图像数据库中要想提高图像的检索速度就必须提高图像的处理速度。由于图
医院信息化建设的不断发展,要求医院建立起自己的电子病历系统。电子病历代替传统纸质病历文档,极大的方便了病历的管理,提高了医院的工作效率。为了保证电子病历跟纸质病历
目前,互联网行业在掀起新一轮云计算和大数据的浪潮,数据挖掘如火如茶,在这其中视频产业尤为突出。与此相对应的是处在信息大爆炸时代的人们,每天都在接受海量数据的冲击。如
日益激烈的市场竞争中,企业在环境的动态变化和自身的能动选择下不断演化,才能生存和发展。企业模型是企业系统的抽象,可以用来分析企业的演化特性。目前,比较常用的企业模型受结
图像分割是图像处理和计算机视觉领域低层次视觉中最基础,最重要的领域之一,同时具有广泛的应用价值。目前,现有的分割算法在实际的应用领域中都存在各种各样的问题,诸如耗时性,目
无线传感器网络是一种新型的信息获取平台,它具有成本低廉、可快速部署、自组织网络,使用灵活性强等诸多优点。无线传感器网络通过将大量的微型传感器节点以随机的方式部署在