论文部分内容阅读
人类的视觉系统是一种多目标跟踪系统。为了便于大脑在最短时间内获得关键信息,人眼会将注意力集中到少数几个区域或物体,这个行为称作视觉注意。这些区域或物体在场景中就构成了感兴趣区域(Region of Interest,ROI)。提取ROI是图像处理、图像增强、机器学习等学科的重点研究方向,可以大大减少计算机对图像压缩编码、目标识别、图像匹配的耗时,有效地提高信息的处理效率。实验室获取ROI的受试人员有限,获得的数据量较小,设备昂贵,无法将ROI获取普及到各行各业。因此,本文探讨如何利用公众资源大量地收集眼动大数据,并具体从流程上介绍了数据获取过程,最后提出一种利用眼动大数据提升图像感官质量的方式。主要工作如下:首先,为广泛收集眼动数据,增加受试人员数量,本文仿照眼动仪改进了虚拟现实眼镜。利用红外光源,在不影响用户使用的前提下,使其可以收集眼动数据,并应用视点跟踪技术获取视线,得到的视点经坐标变换映射到真实图像位置。其次,获取眼动大数据后,本文利用改进后的k-means算法和二维高斯分布模拟来分析眼动数据,得到真实的ROI。考虑到原有K-means算法的不足,本文进行了改进,并利用改进后的k-means算法将ROI识别成功。同时指出,K-means获得的是规则圆的ROI区域,因此可以利用二维高斯分布模拟,使其形成山区高度图,并利用“削山顶法”得到不规则的ROI区域。最后,根据人眼视觉中央凹视区最为清晰的特性,本文提出一种利用公众资源大数据获取眼动数据,并分析眼动数据得出ROI,进而优化图像感官质量的方法。由此可以动态地调节图像质量以匹配不同的带宽,节省下载空间量,从而解决因带宽限制不得不退而求其次下载低清晰度图像的问题。本文在前人研究的基础上,结合当今大数据时代的优势,提出了利用公众资源来优化图像,并利用优化的图像进一步吸引公众资源的这种良性循环的研究思路,拓展了研究视野,开辟了研究道路。