光场视觉显著性分析及其应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：wumingxiaoziwoaini

【摘要】

：

计算机视觉在人工智能的发展中有着举足轻重的作用。在计算机视觉中，基于视觉的显著性预测问题，因为其广泛的应用情景，一直备受研究者关注。一方面，基于显著性区域的预测可以帮助

【作者】

：

孙夏

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2016年期

【关键词】

：

计算机视觉光场图像显著性分析三维信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

计算机视觉在人工智能的发展中有着举足轻重的作用。在计算机视觉中，基于视觉的显著性预测问题，因为其广泛的应用情景，一直备受研究者关注。一方面，基于显著性区域的预测可以帮助机器快速对显著性区域或者物体进行识别，分割，跟踪等操作。另一方面，显著性区域的预测可以在图像和视频等领域帮助压缩，具有优化资源分配等更有实际意义的贡献。目前，计算机视觉领域另一个备受研究者和业界关注的问题是虚拟现实技术及三维显示技术。大多数虚拟现实设备和三维显著的数据来源是光场图像。光场相机因为其在一次拍摄中可以采集场景的多维信息而备受欢迎。光场图像做为一种新的数据格式，在日后计算机视觉的发展中将十分重要。一方面，光场图像的三维信息可以用于三维重建，3D显示等立体视觉显示，颠覆传统的2D成像习惯。另一方面，光场图像所包含的三维信息可以促进物体检测，物体识别等传统问题的发展。本文主要探究了光场图像对于视觉显著性预测这一关键问题的作用。本次论文有如下贡献:　　1.本文创建了一个基于光场图像的视觉显著性数据库(Light Field Visual Saliency，LFVS)并基于该数据库进行视觉显著性分析。该数据库包含动物、植物、人像、风景、玩偶、交通工具等丰富情景的光场图像，总计1187张。这为日后光场图像的研究提供了一个大规模的基准;同时，本论文为该光场数据库设计了眼动实验并记录了在2D情景和3D情景中人眼的视觉凝视图，这为日后的视觉显著性预测的研究提供了丰富的情景。除此之外，本文探究了人眼在2D情景和3D情景中所关注区域的异同，为日后的基于3D情景的视觉显著性预测提供了更多的数据支持以及现象总结。最后，本文对人眼的视觉凝视图的特征进行分析总结，对进一步的视觉显著性预测提供了指引。　　2.本文提出了一种基于光场图像的结合自底向上与自项向下特征的视觉显著性预测方法。该方法充分利用光场图像的深度信息，以人眼的观测机制为依据，主要从低层视觉显著性预测，中层视觉显著性预测和高层视觉显著性预测三个角度对人眼所关注区域进行预测。与传统方法相比，该方法在处理复杂背景，前景背景颜色相似的情景中效果尤为显著。本文在2014年发布的Light Field SaliencyDataset(LFSD)数据库以及本文创建的LFVS数据库上验证了该方法的有效性和可行性。本文提出的模型在多种评估方法上如Auc，similarity，CC，EMD都取得了良好的效果。　　3.本文在光场图像的压缩过程中应用了图像的视觉显著性这一特性，提出一种基于视差补偿的结合HEVC编码的光场图像压缩方法。这种方法首先将光场图像按照一定规则生成YUV色域空间视频序列，再对该视频序列进行HEVC压缩。压缩中对视觉显著性区域进行视差补偿以保留更多资源。该方法在压缩比率较大的情况下仍能较为清晰的保留显著性区域的资源，不影响后期的重聚焦效果。本问使用PSNR以及BD-PSNR来评估该实验效果，基于HEVC的光场图像压缩方法比JPEG2000的压缩方法在相同码率下大约可以提高PSNR约为3dB。基于视觉显著性压缩后的图像的视觉效果和重聚焦效果明显好于普通的压缩方法。

其他文献

刘铁泉作品欣赏

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

刘铁

缪印堂荐评

《宇宙婚礼》

期刊

缪印堂来晚《离婚》一步

基于SPM阵列的高灵敏度三维成像电路设计技术研究

高灵敏度激光三维成像探测是利用激光器设备,通过发射大功率,窄脉冲激光去照射探测目标,并由高灵敏度探测器接收目标回波信号,最终获得目标信息的一种先进光电探测技术。三维

学位

高灵敏度探测三维成像硅基光电倍增管阵列电路设计

角毛壳菌几丁质酶的特性及其基因的诱导和转化

植物病害一直严重威胁着农业生产,生防微生物的应用是植物病虫害综合治理的重要手段,是保护生态环境,实现农业可持续发展的有力保证。角毛壳菌(Chaetomium cupreum)作为一种

学位

角毛壳菌生物防治几丁质酶基因酵母表达

无线局域网中的智能负载均衡技术研究

信息技术的飞速发展为人类带来了极大的便利和无限的可能性，移动互联网、智能手机、智能穿戴设备这些新技术在改善人类生活的同时不可避免的带来了移动数据量的爆炸以及对移动

学位

无线局域网负载均衡多属性决策比例公平

水声线谱信号检测技术研究

线谱信号检测技术一直是水声领域的研究热点。针对水声线谱信号的被动检测问题，本文研究了自适应线谱检测方法和LOFAR图线谱检测方法。　　自适应线谱检测方法是水声信号处理

学位

水声线谱信号检测信噪比自适应多步决策算法

两种家蚕14-3-3蛋白的表达分析及其亚细胞定位

14-3-3蛋白是真核生物细胞中一类含量丰富的高度保守的酸性蛋白质。在对家蚕蛹cDNA文库测序过程中获得了Bm14-3-3ζ的基因序列，GellBank登录号为DN236892。用14-3-3ε蛋白基因

学位

家蚕14-3-3蛋白表达分析亚细胞定位荧光定量PCR

LTE-Advanced系统的频带聚合技术研究

随着科技的飞速发展,无线通信技术也日新月异,人们对高速大数据量的无线通信业务的需求也日趋增长,传统的网络架构面临各种挑战,已经不能满足目前日益膨胀的市场需求。目前,

学位

LTE系统LTE-Advanced系统频带聚合DCI盲检测上行自动重传反馈

OFDMA系统中的分布式接纳控制的研究

在无线网络中接纳控制是一个非常重要而具有挑战的问题,是保证网络中业务的服务质量,合理高效地利用网络资源的基础,对于无线网络的性能提升具有非常重要的意义。在这篇文章

学位

接纳控制OFDMA分布式包时延

基于压缩感知的频谱感知算法研究

随着近年来信息技术的飞速发展，频谱资源匮乏的问题日益严峻。认知无线电技术可以有效提高频谱利用率，因而成为新的研究热点。频谱感知是认知无线电的重要组成部分，它的性能对于

学位

认知无线电信号处理频谱感知检测性能压缩感知

光场视觉显著性分析及其应用

与本文相关的学术论文