选择性视觉注意力的研究：基于频带选择的计算模型及应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户：xiaoaixiaoaixiaoai

【摘要】

：

视觉注意力选择是人类视觉系统(Human Vision System)的一项重要机制，它主要是通过大脑中的视觉系统对眼睛所接收到的信息进行精简和处理，从而将提炼后的信息传输到高级的中枢

【作者】

：

吕琦

【机构】

：

复旦大学

【出处】

：

复旦大学

【发表日期】

：

2014年期

【关键词】

：

视觉注意力频带选择计算模型信息处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

视觉注意力选择是人类视觉系统(Human Vision System)的一项重要机制，它主要是通过大脑中的视觉系统对眼睛所接收到的信息进行精简和处理，从而将提炼后的信息传输到高级的中枢系统。通过这一功能的实现，人类能够很快地注意到视野中有意义的显著区域。在计算机视觉和人工智能领域，视觉注意力通常被作为预处理的步骤，用于实现后续的目标检测、图像分割、图像压缩等。　　视觉注意力的机制分为自底向上(bottom-up)和自顶向下(top-down)两种，本文主要对前者进行了研究。自底向上的机制完全由数据驱动，这一类方法包括仿生物特性的NVT(Neuromorphic Vision Toolkit)、基于相位谱变换的PQFT(PhaseQuaternion Fourier Transform)以及基于工程计算的FTS(Frequency Tuned Saliency)等。其中，NVT和PQFT仅对较小目标或边缘信息的显著性预测有效，而FTS主要针对大目标的显著区域计算。　　本论文首先针对现有视觉注意力模型的缺点和不足，基于生物学上非经典感受野(non-Classical Receptive Field)的发现，从频域分析的角度提出了一种新的频带挑选的方法。该方法同时考虑了空间频率的低频和高频成分信息，在分析了各频带的显著程度后，挑选出最优的频带以生成显著图。这一方法能够预测出不同尺寸目标的显著性，大幅改善了之前模型只针对单一类型数据的缺陷。　　其次，在上述模型的基础上提出了基于白化(whitening)的改进频带选择模型。首先，我们采用去相关以及方差归一化的白化方法，来高效地提取出不同尺寸特征图的显著信息，避免了传统观方法分割或分块带来的复杂运算。另一方面，基于评价指标的优化，我们改进了模型关于挑选频带的权重函数。改进的方法无论对于注视点数据(fixation dataset)还是分割数据(segmentation dataset)都有很好的效果，同时与心理学实验的结果有良好的一致性。　　最后，我们将所提出频带选择模型（自底向上机制），结合直线特征的提取（自顶向下机制），用于遥感图像的机场目标检测。传统检测方法基于滑动窗(sliding window)或者分割，往往计算复杂度较高，而注意力选择可以解决这样的问题。实验证明，通过自顶向下和自底向上机制的信息互补，该方法有更好的检测效果以及更低的虚警率。此外，我们还分析了不同融合策略、不同数量的学习样本以及不同的候选区域数目对检测结果的影响。

其他文献

基于MPC555微处理器的四轮直线行进系统的研究和实现

本论文设计了一个四轮驱动系统的实验模型；根据汽车ABS防抱死系统的原理和目的，采用了改进的数字PID控制算法来实现四轮系统的直线行进；建立了一个基于GNUTools的自由免费的MPC5

学位

汽车电子MPC555集成开发环境防抱死系统数字PID算法微处理器四轮驱动

水稻两个非编码RNA基因的功能研究

非编码RNA(non-protein-coding RNA,npcRNA)发挥着重要而广泛的生物学功能,但迄今对其功能的了解还很有限,对长的非编码RNA(long npcRNA)的功能更是知之甚少。本研究根据预测

学位

非编码RNA基因水稻反向遗传学

Two Bijections on Weighted Motzkin Paths

本文通过对荣华二采区10

期刊

underdiagonal lattice path(22)-Motzkin pathk-Motzkin path(k-2)-Schr?oder pat

IEEE802.11b无线局域网物理层基带处理器接收端的VLSI设计和实现

本文对IEEE802.11b无线局域网物理层基带处理器接收端的VLSI设计和实现进行了研究。文章采用了遵循最小均方误差(MMSE)原则的判决反馈均衡器(DFE)接收构架来减小信号间的码间

学位

无线局域网补码键控反馈均衡器信道估计

基于串行通道的高速通信方法设计与实现

大数据时代,规模巨大的数据集呈爆炸式增长,庞大的数据流使得现代通信系统的数据处理能力和数据通信带宽面临着更大的挑战。传统并行传输方式成为进一步提高数据传输速率的瓶

学位

高速串行传输差分信号FPGADSDDR存储阵列

AlGaN/GaN HEMT的研制

氮化镓(GaN)是直接带隙材料，适合制备光电器件；化学性质非常稳定，在室温下不溶于水、酸和碱；熔点较高(约1700℃)、禁带宽度大(3.4eV)，适宜制备高温、抗辐射器件；电子峰值速度高(室

学位

化合物晶体管铝镓氮氮化镓材料制备

升压DC-DC转换器的管理集成电路设计

近年来，电源产业蓬勃发展，封装、电压和电源架构等技术推陈出新，DC-DC转换器技术也迎来新的发展契机，如开关频率高频化、软开关技术、低压输出技术等，这些技术使得DC-DC转换器向着

学位

开关电源升压DC-DC转换器管理集成电路设计整体仿真

基于C/S结构的拳击比赛信息系统总体设计

体育信息化的程度，也已经成为衡量一个国家和地区运动水平、体育综合实力的重要指标。本课题是专门为拳击比赛系统而设计的，系统满足拳击比赛项目管理的各种需求并实现了对运动

学位

体育信息化拳击比赛管理信息系统

基于DSP的实时算法仿真平台

数字信号处理器(DigitalSignalProcessor，以下简称DSP)的出现，是信号处理系统发展历史上具有里程碑意义的事件。随着DSP的功能日益强大，技术不断升级，系统不断完善，DSP技术的普及

学位

数字信号处理器嵌入式系统算法开发平台原型化设计

基于高阶累积量的MIMO系统盲信道估计方法的研究

由于多输入多输出(Multipel Input Multiple Output)系统采用多发射天线和多接收天线的结构,因而能够充分利用信号的空间资源,进一步提高移动通信系统信道的容量。所以对于大

学位

多输入多输出系统盲信道估计高阶累积量逆滤波器梯度最优化算法频域信道估计子空间投影

选择性视觉注意力的研究：基于频带选择的计算模型及应用

与本文相关的学术论文