多视角多标签分类的模型与算法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:wx669
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类问题一直是机器学习中的热点问题。在过去的研究中,人们解决该问题的关键在于如何建模标签之间的依赖关系,从而提升模型的性能。然而在本文中,笔者受到多视角学习在提升泛化性能上的启发,尝试从一个新的角度提出了一个新颖的多视角多标签概率模型。这个模型,我们称之为潜空间的条件伯努利混合(Latent conditional Bernoulli mixtures,LCBM)。LCBM是一种判别模型,该模型以不同视角的特征作为输入,并且在视角共享的潜子空间下,利用伯努利混合模型来建模标签之间的相关性。为了简化模型的计算方法,在混合模型的每个成分中,我们假设标签之间只假设在给定输入的条件下独立。虽然模型是简单的,但是优化却变得困难了。为此,我们采用平均场变分推理框架对概率模型进行近似后验推理,并提出了一种混合高斯自编码器来进行有效的后验近似。与此同时,我们又进一步地设计了一个可扩展的随机训练算法来优化模型和变分参数。最终的实验结果表明,我们所提出的模型能够适用于不同的多标签分类任务中,如图像标注和鸟类分类,并且在不同的评估指标下获得了优异的性能。此外,多标签分类与传统的分类任务相比,它的标签空间要大得多。因此多标签样本的标注通常比单标签样本的标注更为昂贵和耗时。因此,我们有必要利用主动学习技术来解决这个问题。同样地,在本文中我们提出了三种适用于条件伯努利混合模型的主动学习算法。它利用最小置信度或近似熵或聚类熵来选择最具信息量的数据点。我们还通过动态规划提出了一种快速有效的近似熵计算方法。最后通过实验展示了该方法的优异性。
其他文献
近距离场景下的语音识别已经达到了令人满意的结果,但是由于受到噪声和混响等因素的影响,远距离场景下的语音识别依然具有很大的挑战性。和单路麦克风相比,麦克风阵列波束形
随着存储着海量数据的分布式文件系统的进一步发展,为了满足各种企业、学术机构等组织对数据存取速度的需求,诞生了内存分布式文件系统这一概念。以开源的Alluxio为代表的内
智能手机等移动设备为访问信息和使用计算资源提供了极大的便利,但是,受限于自身的尺寸、大容量电池制造技术的滞后、无线通信网络不稳定等因素,使其越来越无法满足移动用户
近年来,云计算、IPTV和4K/8K高清电视等高速服务的快速发展进一步提高了对于接入网带宽的要求。目前在无源光网络(Passive Optical Network,PON)中,强度调制/直接检测(Intensity
随着DNA微阵列技术、高通量测序技术的不断延伸和迅猛发展,产生了许多的基因表达谱数据、分子相互作用数据、基因组数据。这些数据在研究基因突变、基因识别、基因分型和癌症
当下,计算机技术飞速发展,计算机并发体系结构已成为主流。为使并发体系结构的性能得到充分发挥,多线程编程思想应运而生。但是由于多线程程序运行的不确定性,导致编程人员在
随着汉语学习在世界范围内的推广,汉语教学的学科体系日渐成熟,教学理论日渐丰富,相关研究不断深入细化,课堂活动在汉语教学中的重要性也越来越多地被提及。针对课堂活动的调
作为物联网产业的核心技术,无线传感网络已被应用于生产生活的许多领域。无线传感网络往往被部署于复杂多变或干扰因素诸多的环境中,常会造成感知数据偏离实际,从而导致感知
随着计算机技术突飞猛进式的发展,不管是从硬件还是从软件上,都越来越能满足人们的需求。在计算机技术领域发展中,三维重建越来越成为机器视觉的研究重点,并在地图制图,建筑
近年来,随着多媒体技术飞速发展,越来越多的蒙古文古籍文献被扫描转化为数字图像,以便长久保存。这样做不仅有利于古籍文献的保存,同时也给相关研究人员提供了十分珍贵的研究