特定场景下的可变形部件模型

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wusuowei2100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体检测长期以来都是计算机视觉中的基本问题之一,是进行场景理解,行为分析的基础,在视频监控、自动驾驶系统、机器人制造等问题中得到了广泛的应用。当前主流的检测算法采用基于滑动窗口的检测策略:从滑动窗口中提取特征,将检测问题转化为二值分类问题,即判断待检测目标是否存在于当前窗口中。由于物体的视觉特征会随着视角、光照、姿态等条件的变化而变化,给检测任务带来了很大的难度。大多数检测算法关注的是静态图像的检测,而特定场景下的物体检测又带来了新的挑战:首先,物体尺度范围非常大,滑动窗口大小的选择需要平衡,若窗口过大,则对小尺度目标容易产生漏检;若窗口过小,则容易产生虚检;其次,现实世界中的物体纷繁复杂,小尺度物体的视觉信息不足,极易产生漏检或者与背景发生混淆。训练时间也是检测模型的一大瓶颈,模型的泛化能力有限,针对特定场景训练的检测难以迁移到新的场景。针对上述问题,我们拟利用特定场景提供的上下文信息,采用场景相关特征提高检测精度,将可变形部件模型扩展到多尺度结构,使用概率图模型结合检测模型和场景相关特征进行联合估计。本文的主要研究工作如下:1.分析了特定场景下物体检测问题的难点:物体尺度变化及复杂背景带来的干扰。针对特定场景,在传统的基于局部图像信息的检测策略的基础上,采用基于上下文信息的检测思路,充分利用场景所提供的相关信息,提升检测精度。提出了将可变形部件模型作为局部检测器,使用概率图模型将局部检测器与场景相关的上下文特征结合的特定场景可变形部件模型。2.对物体检测加速算法进行了研究。通过性能分析发现,滤波器与图像特征图的卷积运算是检测过程中耗时最长的部分,即算法性能瓶颈所在。将基于频域加速的卷积加速算法应用于可变形部件模型上,分析了传统卷积算法和频域加速算法的时间复杂度,并进行了实现。3.在两个特定场景公共数据集CAVIAR和LISA上进行了实验,从检测准确率和检测算法效率两个角度对实验结果进行了分析,实验结果证明了使用场景相关信息能够提升检测准确率,同时频域卷积加速算法能够有效提升算法效率。
其他文献
本文从环境艺术设计学科发展历程与教育定位切入,提出在新的时代背景下要改变观念,提出创新设计课程教学内容与方法的改革及对于专业发展、人才培养的意义,为环境艺术设计课
电力工业的市场化改革,给整个电力工业创造了新的发展机遇,但同时也给电力行业提出了许多新的挑战和新的问题,其中输电阻塞就是一个非常关键的问题,是市场环境下保证电网安全运行的核心。本文分析了市场环境下阻塞调度的原则,指出阻塞管理方法与市场的交易模式密切相关。针对电力市场主要的三种交易模式,分别介绍了不同模式下的阻塞管理方法,并在此基础上详细分析了不同市场模式下阻塞成本的计算方法。针对我国电力市场发展现
目前,世界上超过 80%的镁金属产自于中国,硅热法工艺是我国金属镁冶炼的主要工艺方法。该工艺中的镁还原过程效率低、能耗大,能量利用效率为25%左右,大部分热量从炉体和烟气中散失
“远程实训平台管理系统的设计与开发”是基于教育部“面向职业教育的远程共享实训平台的研究与开发”课题进行的。论文旨在研究将当前发达的计算机与网络通讯技术、远程访问
北京apm广受国际品牌的青睐,同时拥有多家最具特色和独有性的国际大牌复式旗舰店,在王府井商圈独此一家,即使在北京也是屈指可数,受到了时尚潮人们的致力追捧。不仅拥有FOREV
PBL教学模式是一种新型的教学模式,将其应用到食品学课程教学中能够提高学生的学习积极性,激发学生的求知欲,提高学生的学习能力。教师将PBL教学模式应用到食品学课堂教学中
两相流是自然界最广泛存在的流态之一,在工业生产和日常生活中有着重要的作用。然而,两相流系统是一个复杂的非线性动态系统,相间存在界面效应和相对速度,检测难度较大。两相
民族地区农村学校义务教育阶段学生英语课程学习存在语言技能较差、学习策略缺失、英语学习信心不足等短板。除此之外,民族地区农村英语课程教学还存在课堂低效的问题,其主要
鉴于目前高职院校计算机数学教学效率较低、学生学习积极性不高的问题,有必要引入案例教学法。案例教学法通过教师展示案例,学生讨论案例,教师归纳提炼,学生演绎并策划出解决
随着信息技术的迅速发展,人们对各类建筑物的使用功能要求越来越高,由自动控制技术、通信技术和计算机网络技术组成的楼宇设备自动化控制系统(Building Automation System-BAS)