【摘 要】
:
在计算机视觉领域的诸多研究方向中,视觉目标检测与跟踪是最基础也是最重要的研究方向之一,同时也具有广泛的工业应用场景。视觉目标检测与跟踪是计算机对环境物体进行感知理解最基础也是最重要的步骤,为进一步的高层级的理解任务奠定了基础。而在众多的目标检测与跟踪的算法中,对目标的定位准确度是其算法整体性能的关键所在。针对视觉目标检测任务,本文着眼于目标定位准确度,通过分析检测结果,发现了当前的视觉目标检测算法
论文部分内容阅读
在计算机视觉领域的诸多研究方向中,视觉目标检测与跟踪是最基础也是最重要的研究方向之一,同时也具有广泛的工业应用场景。视觉目标检测与跟踪是计算机对环境物体进行感知理解最基础也是最重要的步骤,为进一步的高层级的理解任务奠定了基础。而在众多的目标检测与跟踪的算法中,对目标的定位准确度是其算法整体性能的关键所在。针对视觉目标检测任务,本文着眼于目标定位准确度,通过分析检测结果,发现了当前的视觉目标检测算法的一个本质的矛盾问题,那就是检测结果中检测框的分类得分高低和定位的准确度好坏并不是对应的。具体来说,就是定位准确度高的分类得分不一定高,反之亦然。针对这个矛盾问题,本文提出了一种定位质量估计引导的目标检测算法LED模型(Localization-Quality Estimation Embedded Detector)。LED从提升检测框的定位准确度的角度出发,在现有目标检测算法的基础上设计了定位质量评估分支,对目标检测框的定位准确度进行评估,并且把评估的定位准确度与分类得分结合作为目标检测边界候选框的综合得分,提出了定位质量估计引导的视觉目标检测算法。在PASCAL VOC、KITTI等目标检测数据集的实验中,LED在损失较少速度的基础上,有效提升了视觉目标检测的检测精度。进一步的,由于当前的视觉跟踪算法对目标的定位准确度没有特别的研究,并且没有在一些富有挑战性的跟踪场景进行算法跟踪性能的优化,本文针对跟踪场景中经常出现的富有挑战性的尺度变化、形状变化、遮挡等情况下的提升定位准确度问题,提出CAT模型(Corner Aided Tracker with Deep Regression Network)。CAT为了获得定位更加准确的目标跟踪框,将目标跟踪的边界框跟踪问题转化为边界框角点与中心点的跟踪问题,通过对边界框角点和中心点的估计和融合,获得更为准确的跟踪边界框。CAT能够自适应地选择目标跟踪框的关键点子集进行目标跟踪框位置的融合,能够有效应对尺度变化、形状变化、遮挡等场景,给出较高定位准确度的目标跟踪框。在实验中,CAT在OTB、UAV123、La SOT、VOT等数据集上都获得了很好的效果,具有明显较高的定位准确度。
其他文献
随着中国人口老龄化进程的不断加快,老龄患者对医疗的需求正在不断上升,相对应的高龄手术例数也呈逐年上升趋势,虽然当今医疗水平技术飞速发展,手术风险依旧存在。尤其对于高龄患者而言,由于身体素质原因同时伴有大量慢性病,使得手术风险大大增加,对于高龄患者的手术医生往往十分慎重。然而高龄患者对长寿的期望越来越高,想通过手术改善生活质量的意愿也越来越强烈,故在术前做好相应的风险评估显得尤为重要。传统的手术风险
随着人工智能技术的高速发展,人们对自然语言理解、解析和生成的要求也越来越多。而对于四则运算应用题自然语言描述的方法或模型这方面的研究却是少之又少。基于这样的背景条件下,通过研究四则运算应用题文本的特征属性,从中归纳总结出从数字关系到应用题文本自然语言描述的方法或模型,这为本次研究提供了意义。对四则运算应用题文本自动生成方法的研究,主要先从对四则运算表达式开始的,总结出其表达式均由最小单元复合而成。
人脸识别是计算机视觉领域中十分重要的研究方向。人脸特征作为辨识性很高的生物特征,具有非接触式、不易更改、直接等优点,广泛应用于安防、刑侦、电子认证、银行交易等领域中。目前,受限场景下的人脸识别技术发展迅速,在研究和应用上都达到了很好的效果,而随着研究的深入,自然场景下的人脸识别成为了最为广泛且十分重要的需求。受限场景对于采集环境要求较高,自然场景中往往无法满足,其采集的人脸受到多种因素的影响,如表
随着软件开发技术的不断进步,测试验证方法和手段也需要不断完善,常见的负载压力测试已被广泛应用于服务器、Web应用、各类信息系统、网络系统等领域。但是专门针对嵌入式实时操作系统的相应负载压力测试研究还不够广泛和深入。中电32所自主研发的ReWorks嵌入式实时操作系统已被广泛应用于轨道交通、信息系统和工业机器等多种行业中,并被国防军事领域的多型装备所采用,是装备国产化的典型代表。,没有考虑到该操作系
通常软件测试中大部分工作是耗时耗力,其中最代价最高的是错误的定位,而在错误定位上的技术改进能降低测试的工作负荷。目前程序错误定位的方法主要包含基于程序动静态切片,基于程序频谱的语句分析方法等。动态切片由于可以通过分析目标行变量在测试运行过程中的依赖关系,去除不影响目标行变量结果的语句,将关注点转移到相关程序语句以减少考察范围。而基于频谱的软件错误方法(SFL)源于聚类分析中的相似一致性原理,相似性
面部肌肉、神经损伤的患者会出现表情扭曲现象,严重影响了患者的日常生活。对于患者而言,长期定时前往医院进行康复状况检查,需花费大量时间金钱。并且患者面对医生时可能由于紧张、害怕等心理因素导致无法表现出最好的状态,使康复状况评估不够准确。对于医生而言,为病人评估康复状况属于重复性基础工作,占用大量门诊时间,减少接诊病人数量。另外,目前诊疗以医生主观判断为主,尚没有一套客观评价体系能够对病人训练效果进行
人体三维重建作为计算机视觉的一个子领域在最近几年发展迅速,其应用领域也愈发广泛。一方面,这项研究对人们日常生活和工作的方方面面都提供了非常多的帮助。另一方面,这项工作在科研领域也为计算机理解人体三维信息,认知三维世界提供了可能,是未来计算机视觉变革的前沿。为了解决现有的人体三维重建方法存在的耗时长,精度低等问题,本课题在已有的基于深度信息的人体三维点云重建算法的基础上提出了新的基于单目相机的人体稠
显著性检测是指通过模拟人的视觉特征提取图像中的显著区域,是计算机进一步理解和处理图像的重要预处理方式。关于显著性检测的研究已经有很多,但是关于人类视觉系统是如何捕捉到显著性区域尚未有明确的的解释。同时因为大量图像也蕴含着丰富的前后景信息,显著性检测仍然有很大的进步空间。特别是当图像包含一个复杂的场景,如何高效准确地将显著性物体提取出来仍然是一个待解决的问题。随着卷积神经网络的快速发展,显著性检测已
随着移动终端和定位技术的发展,服务端存储能力提升,越来越多的时空数据可以被精确地采集和存储,为基于时空数据的应用发展提供了坚实的基础。其中,轨迹数据是由移动物体产生的一系列时空数据,对于轨迹数据的分析和挖掘能够给人们日常的出行带来一系列便利,比如导航、路径推荐、智能交通等等。其中,对于轨迹数据的异常检测能够从海量的数据当中发现可能存在的异常行为,对于规范轨迹数据产生方的行为具有积极意义。目前,关于