基于分辨率级别学习密集特征的图像区块匹配

来源 :天津大学 | 被引量 : 0次 | 上传用户:lhy_287229489
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像区块是指图像特征点附近的像素区块,可以反映图像的本质特征。图像区块匹配的应用范围广泛,包括图像拼接、物体识别、三维重建、增强现实等,在计算机视觉任务中有着十分重要的作用。本次课题的主要目标是探究深度学习在图像区块匹配中的应用,并提升图像区块匹配的准确率。对于图像区块匹配的早期研究是基于特征工程的,例如SIFT等,是由研究员手工设计的。然而,随着带标签的训练数据越来越多,计算机的计算资源逐步增加,新一代的深度学习描述符已经在效果上超过了手工设计的描述符。本论文关注应用在图像区块匹配的深度神经网络,旨在构造适合的网络结构,提升图像区块匹配的准确率。本论文提出的网络结构命名为DFR-net。该网络在分辨率级别上使用了密集连接模式学习特征,并具有单塔结构,使网络更专注于图像区块之间的关系。其中的RDCNet模块,经过实验证明适合于提取图像区块的特征。本论文还探究了将度量学习应用于图像区块匹配的优势。为确保实验的结果,论文在公开的Brown数据集和HPatches数据集上进行了训练和测试。经过实验证明,该网络对图像区块的匹配任务在准确率上有所提升。
其他文献
在数据分析、模式识别、机器学习等领域中,主成分分析是经典的特征提取算法之一。不论是一维主成分分析还是二维主成分分析,它们都是以欧式距离的平方作为相似度的度量,这样导致过分偏爱距离较远的点,算法鲁棒性较差。虽然大多数现有的鲁棒主成分分析和有关基于F范数的二维主成分分析方法可以减轻图像分析和模式识别领域中对异常值的敏感性。但是,现有方法不光没有保留优化目标中的数据结构信息,也不具有广义性能的鲁棒性。为
随着人工智能与深度学习的高速发展,将具有抽象特征的医疗影像与深度学习进行结合已经成为智能医疗诊断的发展趋势。甲状腺超声影像是基于人工智能进行甲状腺结节相关疾病辅助诊断的重要基础,但已有图像通常包含标记结节位置信息的特殊“十字”标记符号,十字标记干扰了深度学习算法提取到的特征和诊断结果,因此对含有特殊的十字标记的甲状腺结节影像进行修复具有重要的意义。目前图像修复算法在自然图像场景下的修复已经取得了良
视频显著性检测通过模拟人类视觉注视机制,快速辨别动态场景中的感兴趣区域,提高视频数据的分析和处理效率。由于视频场景复杂,包含模糊,遮挡,相机运动等多种干扰因素,加之对象数量多,对象间存在语义交互关系,因此视频显著性检测难度更大,更具挑战性。针对视频显著性检测的关键技术难点在于如何充分理解场景中的语义逻辑,运动特征以及时序关系,以推演的形式合理地计算每一帧的显著区域,以满足显著对象的时间一致性特点。
移动互联网的普及和发展给人们生活的各个方面带来了很大的便利,但是与此同时,为了使用这些便利的功能,人们需要通过互联网传输大量包含个人信息的隐私数据。各种原因导致的数据泄露也得到越来越多的关注。本文对于现有的数据泄露检测技术进行了调查研究,通过对比分析国内外的相关工作可以发现,目前的数据泄露检测方法存在一定的不足。一方面,大部分方法无法保证检测中数据的安全,另一方面,部分使用云端计算能力的方法,检测
利用复杂网络分析方法,对复杂系统中的关系结构及属性进行分析,识别网络中社团结构具有重要研究意义。课题组构建了基于复杂网络算法进行人、物、组织及相互关系的感知、理解、预测的情报分析框架IAF,从基于社会/物理/网络空间中人类电子足迹的大规模社交关联网络(复杂网络)中进行社团检测,是智能情报分析框架中理解模块中的关键功能。本文提出融合网络结构和节点属性的社团检测方法,并进行了实证。首先,提出了结合属性
细粒度图像识别,是一个著名的计算机视觉任务,其目标是识别子类下的辨别性特征,由于不同类别内部具有很大的差异性,不同类别之间具有很大的相似性,这使细粒度图像识别任务增加了难度。现有的方法主要通过视觉的标注信息和基于视觉局部区域定位方法来提取特征,但是这些方法不但对图像数据有大量的标注需求,而且仅仅使用单一视觉模态信息对数据的表示能力有限,无法全面表征物体。因此,为改进上述现有问题,本篇论文提出了利用
随着信息技术的发展,现代社会的正常运转越来越依赖于计算机和互联网,保护计算机系统和网络的安全至关重要。一直以来,恶意代码都是计算机安全的巨大威胁,它常见于各种形式的网络攻击,威胁到个人的隐私和财产安全,甚至危害到国家的安全。因此对恶意代码的检测至关重要。传统的恶意软件检测技术基于恶意代码的签名,这种的方法依靠恶意代码分析人员人工分析并提取出指纹。随着诸如加密、变形和多态等混淆技术的兴起,已有的恶意
社会上不同群体对某个事件的意见可能有所不同,这些意见随着事件的发展而互相影响。探究网络上不同群体意见流的变化与新闻媒体或政府机构对大众的影响力对于政府机构、新闻媒体、大型企业等管理者了解舆情传播影响具有重要的意义。我们提出了一个主题流动模型来理解社会群体内部或跨社会群体间的意见流。首先利用动态主题模型对单个群体的意见流进行分析。然后用余弦相似度从时间相关性与内容相关性两个方面构建多群体间的意见相关
接警日志同时包含时间、空间和案件描述信息,属于典型的非结构时空数据。与时空社交媒体相比,接警日志的数据项之间存在较少的联系,没有形成复杂的网络关系为挖掘数据模式提供有价值的线索,因此,其分析更加依赖对其中丰富语义的挖掘和语义时空模式的探索。实现大规模非结构时空数据的交互探索是一项挑战,主要体现在以下方面:1.非结构化的文本数据处理时间较长,准确率低。2.数据中包含多个维度,同时对多维数据处理耗时长
Meltdown漏洞利用现代处理器体系架构提供的乱序执行(Out-of-Order Execution)技术,打破进程用户空间和内核空间隔离,获取计算机中的隐私数据。为了避免微体系架构水平上的数据泄露,Intel紧急推出了KPTI(Kernel Page Table Isolation,内核页表隔离)补丁,在用户态将用户页表和内核页表隔离成两个页表,保护内核数据。此方法增加了进程在用户空间和内核空