论文部分内容阅读
人类颜色视觉是一种主观知觉,不同个体可能存在色觉差异。虽然存在个体色觉差异,但并不阻碍人们通过颜色词汇进行颜色相关的沟通交流。目前在计算机显示器上颜色显示的控制、彩色图像的存储等领域,主要使用RGB值或CIE色度坐标值来完成。但是RGB值对应的颜色是与显示设备高度相关的,相同的RGB值在不同的显示设备上会呈现出不同的颜色。即使物理上完全相同的色块(具有完全相同的CIE色度坐标值),在不同的空间上下文中也会具有不同的色觉感知。例如在颜色错觉图像中,物理上完全相同的两个色块,色觉感知可能不同。针对上述问题,同时考虑到日常生活中都是用颜色词汇进行沟通交流,本文首先通过视觉心理物理学实验建立一个基于人类主观颜色视觉感知获得的颜色标签数据集,然后使用此数据集训练深度神经网络,实现自动识别图像对应的11种中文颜色词汇,输出对应的颜色标签。这种基于主观视觉感知的颜色识别方法,在一定程度上避免了其它颜色提取方法具有的感知差异特性。本文构建了多个不同结构的卷积神经网络作为多标签分类器,将训练数据集分为两类,第一类包括色块图片和特定类型的图片,第二类只包括特定类型的图片。通过实验进行以下三种对比:两个网络结构的对比、训练数据集的对比、阈值的对比,从而确定出识别率最佳的颜色词汇识别模型,该模型能够准确识别多种颜色词汇,其评价指标F1-measure在不同测试集都能达到75%以上。并与其他颜色词汇识别方法进行比较,在减少了图像主题分割等预处理步骤的同时,提高了图像颜色识别中的准确率和鲁棒性。本文通过前期颜色词汇数据集的设计和建立得到较高质量的数据集,确保神经网络的训练效果,并通过对比不同深度神经网络模型的网络结构、训练集种类和不同的阈值,保证了颜色词汇识别模型的识别率。本文构建的模型解决了现存颜色提取方法的一些局限性问题,例如提取的颜色值和视觉主观感知存在差异性。由于识别的是颜色词汇,这对基于色彩线索的图像检索技术有一定帮助,并且更利于日常沟通交流中对色彩的描述。