面向智能书柜的书脊检测与识别关键技术研究与实现

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:chinajovi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的快速发展,为了降低人工成本,图书的智能化管理是一个重要研究方向。本文面向智能书柜这一应用,其功能是通过对书脊的检测与识别方式完成图书的自助借还。现有书脊检测与识别方法主要有基于RFID技术的识别和基于图像文字识别两种,但是RFID技术存在较高的硬件成本问题,而基于图像文字识别的方法又存在识别准确率低的问题。不同于以上两种方法,尤其不同于基于图像文字识别的方法,本文将书脊检测与识别问题转换成基于实例分割的书脊检测、书脊图像特征提取和检索来解决,在速度和精度上取得了良好的书脊检测与识别效果。具体内容如下:(1)设计并实现了基于深度学习实例分割的书脊检测方法。在COCO数据集预训练得到的Mask R-CNN实例分割模型的基础上,采用迁移学习的思想,使用自建的数据集对该网络再次训练;针对存在相同倾斜角度的书脊,采用霍夫变换直线检测进行校正;对具有不同倾斜角度的书脊,提出了基于多旋转的Mask R-CNN书脊检测模型,提高了算法的精确度和鲁棒性;为了提高书脊检测效率,改进了区域建议网络,使用K-Means算法结果设计了适合的书脊anchor比例。实验证明本文方法较以往书脊检测方法效果有明显改善。(2)研究并实现了一种基于CUDA框架下的SIFT特征点提取方法,解决了CPU下SIFT实效性差的缺点。分析了SIFT算法的可并行度,并设计了CUDA框架下SIFT执行流程;分析并对比了GPU和CPU两种环境下实现SIFT算法的差异性。实验证明该方法对比CPU的SIFT算法实现,在特征提取上速度行有10倍以上的提升。(3)提出了一种基于SIFT图像特征编码与检索书脊识别方法。研究并分析了VLAD(Vector of Locally Aggregated Descriptors)、FV(Fisher Vector)和BOF(Bag of features)三种编码算法之间的差异性。针对编码后特征向量维度较高问题,利用主成分分析实现特征的降维,以减少特征的冗余;为了提高检索效率,使用了基于局部敏感哈希检索算法,并通过实验选择出了该算法的最优参数;实验对比了不同特征编码、检索算法与特征表示对书脊识别率的影响,证明本文方法较其他基于图像特征检索的书脊识别方法的性能和效率方面均有明显改善。(4)设计并实现了面向智能书柜的无人图书管理系统。分析并设计了该系统的总体架构和数据模型;基于C/S架构,实现了面向移动端用户的APP与Windows端书脊检测与识别算法验证程序,提供给用户无感知的借还书籍体验,方便了管理员对该系统信息的管理。
其他文献
由于近年来信息物理系统(Cyber-Physical System,CPS)、物联网(The Internet of Things,IOT)等新概念新技术的火热,人机交互技术显得愈发重要。这些新技术都围绕着将现实世界和信息世界合二为一这一主题,在这个过程中,手势作为一种方便使用的人机交互方式获得了大量的关注。本文对安保机器人的手势控制进行了研究,主要研究内容与创新点如下:(1)对安保机器人控制系统
无人驾驶技术被认为是未来的发展趋势之一,是当前研究的热点,人们希望通过无人驾驶技术缓解交通上的种种问题。无人驾驶汽车通过配备的各种传感器对周围环境进行感知,多线激光雷达和毫米波雷达在无人驾驶汽车上广泛应用。本文基于激光雷达原始点云数据以及毫米波雷达数据研究环境建模技术,主要研究内容如下:(1)提出一种基于点云空间邻域多特征的点云分割算法。首先利用栅格内最大最小高度差特征进行点云粗分割,然后对粗分割
机器人对于人类生活和工作的革新有很大帮助,多机器人系统更是未来机器人的发展方向,对于制造业、加工业、危险环境和未知环境等都有很重要的意义。多机器人系统任务分配即为机器人和任务间寻求一种良好的对应关系,对于多机器人系统的执行效率至关重要,决定着多机器人系统完成任务的时间和资源消耗等多种因素。通常多机器人系统具有并行、冲突、可选方案多等特点,因此如何合理地分配系统内机器人在何时使用何种资源执行何种任务
本课题以人脸图像为主要研究对象,将人脸图像转换为具有艺术家绘制风格的肖像素描画,并将得到的肖像画通过处理、计算得到可供机械臂绘制的坐标序列。具体内容如下:(1)研究了语义分割的发展现状,利用双边分割网络Bise Net作为分割的基础网络,并针对它网络较浅、上采样方式粗暴等缺陷对其进行了一系列改进,主要有:在空间路径中加入残差模块以增加空间路径的深度,重新构造了上下文路径使其更充分地利用不同尺度的特
跟随机器人需要在自主跟随的同时避开环境中的障碍物,安全区域特指环境中可以自由通行的无障碍区域。为解决跟随机器人在户外环境下的目标定位和自主跟随问题,本文在以下几个方面开展工作:首先对跟随机器人进行软硬件设计,设计了可在户外工作的履带式底盘,该底盘采用双流传动机构,具有转弯半径小、功耗低、控制简单的特点,提高了跟随机器人的机动性和环境适应性。机器人采用UWB和单线激光雷达融合的传感器方案。基于UWB
预测在现实生活中有着重要的意义,预测的目的在于通过对未来进行合理地判断和规划使得事情往有利的方向发展。深度学习作为一种科学有效的预测方法,被广泛应用到预测领域中,并取得了良好的效果。因此,本文基于深度学习模型中的生成对抗网络,研究了其在复杂产品费用预测和软件业务系统状态预测领域的应用:(1)传统的深度学习模型需要大量的数据对神经网络进行训练以此保证预测结果具有较好的准确性。然而,由于复杂产品本身的
蛋白质结构信息在生物学、医学、药物学等多个领域都起到重要的作用。然而使用生物学实验来的得到结构耗时且昂贵,远不足以解析自然界中存在的巨大数量的蛋白质。所以基于序列的蛋白质结构从头预测具有巨大的理论价值和现实价值。蛋白质残基接触图是蛋白质空间结构的一种低秩表示。它约束着氨基酸间的距离,因此对重构蛋白质结构至关重要。作为一个分类问题,蛋白质接触预测存在一定特殊性:包括蛋白质接触的阈值是人为规定、蛋白质
近年来,随着智能移动设备的迅猛增加和网络多媒体应用的快速发展,移动用户对无线网络数据的需求呈爆炸式增长,加剧网络传输压力。基于小基站网络的移动边缘计算和无线缓存技术利用小基站的计算和存储能力,将流行的多媒体信息缓存在网络边缘端,有效降低数据冗余传输,提高内容下载速度和无线网络的传输效率,从而提升用户体验。本文面向小基站网络架构,设计了三种动态缓存内容更新算法,以提高小基站缓存命中率,降低主干网络中
本文以某自动装填系统中链式弹仓子系统为研究对象,结合滑模控制、自适应控制、扰动观测及模糊控制等先进控制理论,对链式弹仓位置控制系统相关问题进行了深入研究。主要研究内容包括以下几部分:(1)详细阐述了链式弹仓系统的结构特性、工作原理。对链式弹仓系统进行了动力学分析,以其执行机构为等效元件,根据动能守恒定理得到弹仓系统的等效数学模型,为后续链式弹仓控制系统的设计奠定了基础。采用三维建模软件建立弹仓系统
目的 研究地奥心血康对大鼠非酒精性单纯性脂肪肝(nonalcoholicfattyliver,NAFL)的治疗作用。方法 将♂SD大鼠,随机分为正常组和造模组,高脂高胆固醇饲料饲喂8周,待造模成功后将造模组大鼠随机分为模型组、阿托伐他汀组(2.0 mg·kg–1),地奥心血康高、中、低(100,30,10 mg·kg–1)剂量组,每组10只,灌胃给药连续8周。油酸-棕榈酸(Oleic acid-p