基于多目标优化的多标签分类算法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:aajilin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是模式识别的核心研究内容,其目的是通过对己知标签数据集的学习设计一个分类器,然后用该分类器来预测新样本的标签。按照样本所属标签个数,分类问题可以分为单标签分类问题和多标签分类问题。在多标签分类问题中,标签与标签之间存在着一定的依赖或关联关系,而且问题中的样本可以同时属于多个标签,因此多标签分类问题是最为复杂的分类问题之一。目前,现实世界中存在着大量的多标签分类问题,多标签分类算法有非常广泛的应用前景,它将会引起人们越来越多的关注和重视。   对于多标签分类问题,本文提出了一种新颖的直接处理多标签分类问题的方法,该方法在一个优化问题中同时考虑所有的标签,保持标签与标签之间的关联关系。我们算法的基本设计思路:首先根据多标签支持向量机Rank-SVM的基本原理,建立两个目标优化函数,即最大化分类间隔函数和最小化排序损失函数,然后引入多目标优化技术,利用目前广泛使用的进化多目标优化方法即改进的非劣分类算法(NSGA-II)来同时优化这两个目标函数,从而直接处理多标签分类问题。   在算法的实验部分,本文归纳了多种常用的多标签分类算法的评价标准,然后在四个公开的基准数据集,即酵母数据集、场景数据集、情感数据集和基因数据集上开展计算实验,并与一些现有的多标签分类算法进行分类性能比较。由于任何一个多标签分类算法都不能保证在所有的评价标准上都能达到最优,因此,本文为实验中各个算法的每个评价标准进行打分,然后求每个算法的总得分,根据这个总分对所有算法的性能进行排序。实验结果表明,在与BoosTexter、Rank-SVM、ML-kNN、OVR-SVM、OVR-kNN、OVR-C4.5、OVR-NB等众多多标签分类算法进行性能比较后,本文提出的算法在所有的实验中都有较好的排名,分类性能良好。
其他文献
网格计算作为一种新型的大型分布式计算,从其提出到现在一直受到了学术界和工业界极大的关注。随着网格技术的不断发展,网格已逐步发展细化为计算网格、数据网格、服务网格以
医学图像可视化技术是当今计算机科学研究的一个热点,它能弥补医疗影像设备在成像上的不足,为医生提供具有真实感的三维图像,便于医生从多层次、多方位观察与分析,引起了越来
访问控制策略有效地保障了信息系统的安全性,它是指实施允许被授权的主体对某些客体的访问,同时拒绝向非授权的主体提供服务的策略。随着信息化步伐的加快和计算机技术的发展
随着计算机科学的迅速发展,软件规模日益庞大。现在人们在考虑软件执行效率的同时,也越来越关注其安全性(Safety)。高可信软件的研究致力于使用前沿的技术和工具来提高计算机
深度学习作为机器学习领域的一个重要研究方向,在近年来发展迅速。深度学习的主要思想是通过构建多层的深度网络结构,使用高效的算法逐级提取数据的高级特征,来完成多种无监
SOA(Service Oricented Architecture面向服务的架构)基于这样的理念:将业务功能作为一系列的服务而提供,并将这一系列服务组装起来的解决方案来满足特定业务需求。SCA(Service
计算机支持的协同设计(Computer Supported Collaborative Design,CSCD)已经成为网络环境下数字化设计与制造的关键技术之一,能够较大幅度地缩短产品设计周期,降低产品开发成
随着Web服务技术的发展,越来越多的服务提供方以Web服务形式提供服务,当单个简单Web服务无法满足需求时,需要组合多个Web服务来完成,在组合过程中如何高效准确组合现有服务成
移动增值业务结合了互联网与移动通信的技术优势,在满足人们随时随地获取信息需求的同时,还可以提供除语音业务外的多媒体业务、交互式数据业务、电子商务等其它丰富的业务应
程序验证用逻辑证明的方法证明程序满足其规范,是实现安全性的重要方法。出具证明编译器(Certifying Compiler)是编译器与验证器的结合。本文描述的出具证明编译器项目CComp让