基于视频的空中目标检测研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jackywang1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近空目标检测和快速移动的小目标检测一直是计算机视觉领域的前沿课题。目标在视频中的空间信息随着时间不断变化,给检测框架带来巨大的挑战。本文的主要工作概括如下:(1)分析了多阶段目标检测算法框架检测流程,使用时空图像立方体作为输入,提取了同时具备时间和空间信息的特征,并采用了三维卷积神经网络(3D-CNN)、基于3DHOG的提升树算法和属性迁移这三种不同的分类算法分别进行目标检测。为更好地利用时空立方体的时空信息,本文还提出了基于时空立方体的关联边框修正网络(Relevant Bounding Box Adjustment Based on Spatiotemporal Cube,ST-RBBA)对目标检测结果进行优化。(2)分析了单阶段目标检测网络的训练过程,对真实边界框采用了新的增强方法,并对同一输入使用了增强的多个标签进行网络训练,从而有效避免了训练结果过分依赖与手工标记的边界框。为弥补单阶段目标网络无法利用视频在时间上的上下文信息的缺陷,提出基于伪时空立方体的关联边框修正网络(Relevant Bounding Box Adjustment Based on Pseudo-Spatiotemporal Cube,PST-RBBA)对目标检测结果进行优化。(3)为更好地利用视频数据中空间和时间信息之间的关系,针对空中目标检测,提出了基于时间信息的轨迹矫正记忆网络(Trajectory Correction Memory Network,TCMN)对本目标检测框架做了进一步优化,利用RNN/LSTM的记忆功能,使检测到的目标与唯一飞行路径绑定,让检测结果具有更好的连续性和一致性。本文的实验采用了斯坦福大学公开的无人机视频数据。实验结果表明,ST-RBBA能提升3D-CNN 2%的平均交并比(mIoU);Retina Net和YOLO目标检测框架使用多标签训练法后检测效果更好;多标签YOLO、3D-CNN、ST-RBBA-3D-CNN和HBT四种检测框架经过TCMN优化后,检测结果的平均检测精度(AP)在无人机数据集上分别提升了3.3%、0.9%、0.5%和0.4%,在飞机数据集上分别提升了2.5%,2.7%、0.1%和17.9%;并利用TCMN对多标签YOLO的矫正轨迹分析了飞机和无人机飞行行为。
其他文献
在自媒体背景下,研究大学生网络舆论现状及规律,研究影响大学生网络舆论行为的影响因素显得尤为重要,通过研究表明,大学生网络舆论行为受大学生观念因素、校园网络舆论引导以及社
河道岸线是指河流水陆边界线两侧具有综合利用开发功能,并有一定范围的带状区域。岸线由岸线功能区和控制线构成。明确河道岸线控制线与河道管理范围的关系,阐明岸线规划在涉水
胆结石又被称为胆石病,属于慢性、复发性肝胆疾病,易受各种因素的影响,具有多发性、难治性的特点,还可能导致急性胆源性胰腺炎和胆囊癌等,是一种严重危害人类健康的常见病。
目的:研究血小板衍生生长因子(PDGFs)家族在原发性胃腺癌组织中的表达,阐明其与原发性胃腺癌临床病理特征的关系。方法:选择手术切除并经病理证实的58例原发性胃腺癌癌组织及其对
以硫脲和羟基磷酸钙复配体系为固定剂,结合SEM表征手段,研究其在水溶液中对重金属离子(Pb2+、Cd2+、Hg2+、Cu2+和Zn2+)的去除反应及其固定过程。结果表明,羟基磷酸钙对重金属
<正> 会议是商界的日常事务,对于公司事务策划者来说更是如此。有些人喜欢开会,有些人却很讨厌开会。不管你喜不喜欢,你不得不承认会议对于解决问题、共享信息和制定决策是非
期刊
区域发展规划( R D P)是区域生产力和区域经济与社会发展到一定历史阶段的产物,是对未来一定时间和空间范围内经济和社会发展等方面所做的总体部署。本文将社会主义现代市场经济理
采用静态吸附法,研究了SCD-120阳离子交换树脂对镁离子的吸附,考察了氯化镁、溶液p H、温度、吸附时间对镁离子吸附量的影响,并对SCD-120树脂吸附镁离子的类型、速率及吸附过
本刊讯为了加强对临汾市安全生产领域中介服务活动的监督管理,规范安全生产中介服务行为,提高安全生产中介活动服务质量,今年,临汾市安监局采取了有效措施,对安全中介活动的服务
报纸
目的:总结大面积脑梗死的临床特点、早期诊断、治疗转归和预后。方法:以梗死面积>4cm,或梗死面波及两个脑叶以上者,也又称梗死范围大于同侧大脑半球1/2或2/3的面积为标准选择