【摘 要】
:
基于图像的定位算法作为一门融合计算机视觉、机器学习、多视图几何、图像检索等众多科研领域的交叉性学科技术,在机器人导航定位、现实增强、三维重建、地标识别等领域有着
论文部分内容阅读
基于图像的定位算法作为一门融合计算机视觉、机器学习、多视图几何、图像检索等众多科研领域的交叉性学科技术,在机器人导航定位、现实增强、三维重建、地标识别等领域有着关阔的应用前景和巨大的研究价值。基于图像的定位技术也是高层次图像处理任务不可缺少的组成部分,其典型应用包括图像中物体的语义标注、通过提供相机初始姿态加速大规模SFM模型重建等。本文在阐述相机模型、PNP算法、RANSAC算法、SFM算法、CNN理论、传统VLAD算法的基础上,总结归纳了基于图像检索、基于特征匹配和基于逻辑回归三大主流图像定位算法的优缺点,并提出了基于VLAD-CNN图像检索的定位算法。本文的研究内容和主要工作如下:(1)在对现有算法和理论深入理解的基础上,实现了 SPTR-RANSAC算法、P4Pf算法。从包含噪声数据的2D-3D匹配关系中,利用融合P4Pf的SPTR-RANSAC算法可快速、有效的求解待定位图像的6-DOF。(2)针对图像检索过程中,实时构建k-d树搜索结构容易造成算法效率低下的问题,本文实现了 GPU版本的KNN(K Nearest Neighborhood)算法,用于加速邻近点的查找。通过GPU强大的并行执行能力减少特征匹配所需时间,提高基于图像检索定位算法的效率。(3)针对传统图像检索定位算法的不足,本文提出了基于VLAD-CNN的图像定位算法,并详细论述了 NetVLAD网络层基本原理,介绍了 VLAD-CNN网络的基本结构、基于SFM模型的自动样本标定方法和训练过程中采用的损失函数。通过与现有主流算法在公共数据库上的对比实验,验证基于VLAD-CNN图像检索定位算法的合理性和有效性。
其他文献
1965年Zadeh提出模糊系统理论以来,模糊系统在越来越多的领域得到了应用。但是模糊系统的规则总数会随着输入量个数的增加而呈现指数增长,当输入量个数过多时会出现“维数灾
多相系统较传统的三相系统具有优势,本文的双三相感应电机控制系统是一种典型的多相系统。但是传统的双三相感应电机的驱动拓扑大都为单级桥式结构,在电源输入功率一定的情况下,采用单级桥式驱动拓扑的大功率多相系统会造成电源输入端大电流。本文提出基于两级串联桥式驱动拓扑的双三相感应电机控制系统,继承了传统多相系统优势,在电源功率一定的情况下,相较于单级桥式驱动拓扑虽然采用两级串联桥式驱动拓扑的大功率双三相感应
列车接近预警是铁路安全领域的重要组成部分,是铁路列车安全运行以及铁路施工人员安全作业的重要指标。因此要能够及时准确的识别列车接近变得非常重要,所以本课题就是基于列
伴随着我国市场经济的快速发展,人们生活水平得到提高的同时,对健康的要求也越来越高。近年来,为了改善因工作繁重、生活压力大造成的身体亚健康状况,理疗保健越来越受到社会的重
随着当代技术的不断革新以及经济的高速增长,人们的生活水平得到了极大的提高,随之而来的是社会各行各业对电能的需求量日益增加,同时对供电质量和安全性的要求也在不断提高。电压作为衡量电能质量的重要指标之一,直接影响着电力系统安全稳定的运行,而且随着用电负荷的飞速增长,导致很多地区的电压不满足国家标准值,甚至会出现用电设备无法正常工作的情况。影响电压质量的主要原因是系统提供的无功功率不足或无功功率分布不合
行人跟踪是智能视频分析领域的一个重要研究方向。在行人跟踪算法基础上可以直接实现人流统计、越界检测等智能视频监控方面的应用,而行人跟踪作为一些更高层次的智能视频分
一直以来,图像分割都是计算机视觉领域的一个关键问题,图像分割的效果将直接影响到图像的下一步分析和处理。同时,它也是图像处理领域的一个经典难题。在图像分割算法中,直方
传感器实验仪作为掌握传感器相关知识和获得传感器性能的主要工具之一,可以完成对传感器性能的验证性和测试性实验,在工科院校、相关研究单位以及生产部门具有广泛的应用。目
水泥工业作为基础性原材料的支柱产业,在国家经济建设中具有举足轻重的地位。水泥联合粉磨是水泥生产关键环节之一,决定了水泥的质量与产量。由于水泥联合粉磨系统的高耗低效
本文从功率控制角度出发,考虑有上位机控制和无上位机控制,采用改造后的串行蚁群算法和并行蚁群算法对两种情况进行能耗优化,并分析在网络节点非均匀分布情况下算法的优化结果。