【摘 要】
:
人眼扫视路径,是人类观察者在没有外在任务要求自由观察的条件下,人眼浏览图像或者视频时视觉注意力所形成的轨迹,能够体现出眼球运动的动态过程。相比于视觉显著性,人眼扫视
论文部分内容阅读
人眼扫视路径,是人类观察者在没有外在任务要求自由观察的条件下,人眼浏览图像或者视频时视觉注意力所形成的轨迹,能够体现出眼球运动的动态过程。相比于视觉显著性,人眼扫视路径更能够反映人类的视觉搜索行为,从而加深研究人员对动态视觉注意力的理解。因此,深入研究人眼扫视路径,对于推动视觉行为认知领域的科学研究进展,加快实现更高层次的智能机器感知,具有十分重要的科学价值。国内外目前的人眼扫视路径预测研究,一类是利用人类视觉系统相关的生理学原理,构建扫视路径预测模型,这类方法能够很好地对注视点之间进行时序建模,具备较好的可解释性,但缺乏较强的视觉特征表示能力,取得的预测精度不高。另一类是使用基于深度神经网络模型,直接利用图像和眼动数据进行端到端的学习,预测效果较好,但鲜有显式地利用到视觉生理学机理,仍存在较大的改善空间。本文针对这些问题,提出了一种同时考虑视觉生理学基础和深度学习计算模型的方法,实现了在自由观察条件下的人眼扫视路径预测。其中,本文提出了中央凹视觉显著性预测模型,实现了图像局部空间的选择性视觉注意力建模;还提出了基于图像局部感兴趣区域内容的注视点时长预测模型,实现对人类注视行为时间的模拟;最后,本文利用中央凹视觉记忆和动态的注视点时长,对经典的返回抑制原理进行了重新建模,使得图像的空间内容和视觉记忆的时序衰减,与人眼最终的扫视路径点建立了关联性。各个模块紧密联系为一个整体,实现了利用任意单张图像自适应地预测人眼的扫视路径。本文提出的方法,可以同时处理注视点之间的时序依赖性,以及图像的空间特征与注视点之间的相关性带来的挑战。本文提出的算法,在目前公开的几种眼动数据集上进行训练和测试,在多个客观评价指标上,均取得了当前最佳的人眼轨迹预测效果,并且通过对算法的几个重要方面进行了全面的分析性实验,验证了本文提出的算法的有效性,最后讨论了算法的不足以及未来的改进方向。
其他文献
二十世纪后半叶的法国文坛中,米歇尔·图尼埃是一位不容忽略的大家。他的作品虽然在叙事形式上并无“新小说”派那样颠覆性的改革,但仍以其中蕴含的神话和历史渊源、深邃的哲
密度极限问题是所有低杂波电流驱动实验都无法回避的问题,如何提高高密度条件下的电流驱动效率是目前低杂波电流驱动研究的重点。相对于低场侧区域,托卡马克内的高场侧区域具
随着智能移动设备和社交网络服务的快速增长,现有的无线网络承载着越来越大的负载压力。雾无线接入网可以通过将流行内容缓存到距离用户较近的接入点来缓解网络拥塞,用户无需从云服务器获得所请求的内容,因此前传数据得到卸载,并且传输时延得以降低。在雾无线接入网中,雾接入点具有一定的缓存容量和计算能力。一方面,由于缓存容量和计算能力的限制,为了达到更好的网络性能,雾无线接入网中的性能分析变得越来越重要,另一方面
本文主要是关于推荐方法的研究,该任务目的是预测用户对给定物品或对象(如酒店,视频,商品,音乐等)的打分或喜好。现有的主流解决方案是通过协同过滤或者基于内容的过滤方法产
汽车行驶过程中,汽车空调系统会受到来自发动机和压缩机等各类复杂载荷的激励,若管路系统设计不满足要求,会导致空调管路在激励作用下发生疲劳断裂现象,严重影响汽车的安全性
20世纪以来,以儒学为代表的传统文化日渐从人们的生活中退场。但作为转型期知识分子的杰出代表,冯友兰和牟宗三致力于实现中国传统文化的现代化。二人都注重形上学体系的建立
诺贝尔文学奖得主法国作家帕特里克·莫迪亚诺是当今文坛上极具独创性的作家,他的作品风格独特,有很高的辨识度。莫迪亚诺的作品中心围绕着对人类生存困境的思考,他的早期作
最近几年,随着人工智能和大数据的发展,机器学习越来越多的被应用到医疗领域,我国也提出了医疗大数据的发展方向。论文通过数据挖掘,从数据的角度挖掘生理指标和血尿酸之间的
现实中的许多高维数据往往具有潜在的低维子空间的结构。自表示子空间学习假设来自多个子空间的数据是可由其本身重建的,并已经成功应用于高维数据的聚类任务中。现实许多标
我国华南、西南等地区的基础工程建设大量涉及全风化花岗岩地层的防渗加固,该地层呈致密砂砾石状,细微裂隙发育,遇水易软化崩解。对该类地层进行防渗加固灌浆,现有技术主要存