【摘 要】
:
多标记分类研究一个对象同时与多个标记相关的问题。与传统的单标记分类相比,多标记分类更普遍,在许多领域,例如多主题文本分类、图像与视频标注等方面都具有实际的应用意义
论文部分内容阅读
多标记分类研究一个对象同时与多个标记相关的问题。与传统的单标记分类相比,多标记分类更普遍,在许多领域,例如多主题文本分类、图像与视频标注等方面都具有实际的应用意义。所以其越来越受到关注,目前,已经有大量多标记分类算法被提出。其中,多标记线性判别分析算法(MLDA)是一种有效的处理多标记分类的方法,但其不能保持数据的局部几何结构。本文针对多标记分类进行了研究,改进了多标记线性判别分析算法,主要研究工作和创新点如下:(1)原始的MLDA算法通过对经典的线性判别分析算法(LDA)中的散度矩阵进行重新定义,并且考虑了标记间的联系,较好地处理了多标记分类问题,但是,MLDA忽略了数据的局部几何结构。而在近年来的很多研究中都表明,局部结构信息对于降维是十分重要的。为了解决这个问题,本文引入图正则项,对多标记线性判别分析算法进行改进,提出了新的图正则的多标记线性判别分析算法(GR-MLDA),同时保持了数据的整体和局部几何结构信息,提高了算法的性能。通过实验,我们在多个数据集上,和多种算法做了比较,证明了GR-MLDA的性能优于原始的MLDA算法。(2)在原始的MLDA算法中,当数据集维度较高时,计算的时间和空间复杂性都非常高,本文通过去除矩阵中零空间的思想,在求解GR-MLDA目标函数的特征值问题之前,去除了散度矩阵的零空间,然后再计算特征值问题,从而优化了高维数据降维的计算过程,降低了时间和空间的复杂度。实验证明,原始MLDA的计算时间甚至是GR-MLDA的几百倍。(3)已有的许多判别方法都假设数据集是干净无噪声的,直接将样本投影到子空间,从而不能处理训练集中由于遮挡、镜面反射或者噪声等造成的异常值。在本文中,通过引入低秩和稀疏矩阵,提出低秩稀疏的多标记线性判别分析算法(LRS-MLDA),将原始数据分解为一个低秩矩阵和一个稀疏矩阵之和,去除了原始数据集中的异常值,消除了遮挡、噪声等影响,提高了算法的性能。实验结果表明我们的算法确实改进了多标记线性判别分析算法。
其他文献
当前图像数字水印技术以其在版权保护方面的独特优势成为当前研究的热点。而小波分析则是近年来迅速发展的新兴学科,它具有多分辨率分析的特点,将其应用于图像处理的思想是把
随着Internet技术的迅速发展,Web资源的更新频率令人瞠目结舌。然而,在Web信息资源迅猛发展的同时,人们不能忽视信息极大丰富而知识相对匮乏的问题。所以,如何获得对用户有价
协同过滤(Collaborative Filtering)作为一项信息发现技术,近年来被广泛应用在推荐系统的实现中。协同过滤利用所有用户(User)跟所有物品(Item,被推荐的内容)的历史交互信息,
随着计算机视觉研究领域的不断拓展,许多新的图形图像形式逐渐成了计算机视觉研究的对象,同时对处理结果的要求也越来越苛刻。在这背景下,一些新的视觉特征结构提取算法逐渐
计算机软硬件技术飞速发展,有力地推动了嵌入式系统等专用计算机系统的广泛应用。一方面,在很多嵌入式系统中,系统使用者往往要求具有菜单、窗口和按钮等图形元素的人机交互
在经济全球化背景下,虚拟企业成为未来制造企业的主要运作模式。在信息技术领域,网格技术致力于提供支持虚拟企业的信息基础设施。利用网格及其相关技术构建制造网格是制造企业进行网络化制造的发展趋势。资源管理和调度是制造网格的核心技术之一。本文在分析网格资源管理与调度需求的基础上,提出制造网格资源管理和调度的多Agent模型。模型中主要包括用于代表制造网格资源的Resource Agent,用于代表用户的B
近几年随着无线通信技术、传感器技术、信息采集和处理技术的飞速发展,出现了低成本、低功耗、多功能的微型无线传感器节点。无线传感器网络是随着传感器节点的发展而兴起的
多年来,很多有理想互相关特性的周期为2 n ?1(n为非负整数)的二元序列族被提出,包括:Gold序列族;针对奇数n与Gold序列族具有相同互相关函数分布的类Gold序列;针对偶数n Udaya
近年来,由一组相互独立的系统组合而成的复杂系统,亦即“系统的系统”(System of Systems, SoS)逐渐引起了研究人员的重视。由于SoS的地理上的分散性、系统之间的复杂的交互
计算机网络在提供开放和共享资源的同时,也不可避免的存在着安全风险。了解网络系统现有以及潜在的风险所在,评估这些风险可能带来的安全威胁与影响程度,是实施安全建设必须