论文部分内容阅读
目前超市商品结算主要通过条形码或RFID标签技术实现,条形码需要人工扫描,结算效率低,RFID 标签成本高且不可重复利用。因此,如何利用人工智能技术实现超市商品的快速检测与识别以实现自动结算,成为近几年的研究热点。本文基于此展开研究,提出了一种基于深度学习的超市商品检测与识别算法,以降低商品结算成本,提高效率。
针对超市商品种类繁多且商品特征存在局部性等特点,本文从应用场景出发,利用左、上、右不同方位摄像头采集传送带上商品不同面图像,引用基于相位相关和纹理分类的 SIFT 图像拼接算法对商品图像进行拼接处理,并通过图像检测算法检测商品的敏感特征和整体特征,最后利用基于随机森林的多特征融合商品识别算法实现商品的快速识别。
本文主要研究内容包括以下三个方面。
(1)针对Retinanet网络模型检测精度低、速度慢等缺点,提出了基于改进Retinanet的图像检测算法。该算法首先利用信息交互融合技术和改进的特征金字塔提取图像纹理特征及高频抽象特征,然后引用SSH检测网络代替原网络模型中的分类回归子网络,以扩大图像检测面积,最后利用加权损失进行回归,以提升图像检测效率。在RPC数据集中,相较于原始的Retinanet网络模型,本文算法的检测准确率提升了3.90%,达到96.69%;单张图像的平均检测时间由0.201s降低至0.145s,检测速率提升了27.86%。
(2)针对商品外包装包含条形码、文本序列等高可信特征,提出了基于T-Densenet条形码检测算法和Wh-CTPN文本序列检测算法。基于T-Densenet 条形码检测算法通过增加Densenet网络层,并且重新调整anchor值以增大条形码覆盖面积,进而准确、快速地检测商品的条形码特征。Wh-CTPN文本序列检测算法通过对CTPN算法中的Side-refinement 公式重新进行定义实现文本序列信息的准确定位,进而提取出商品的商标、规格、文字描述等重要文本信息。
(3)针对商品特征的多样性,提出了基于随机森林的多特征融合商品识别算法。该算法利用 Zbar 条形码识别算法、Simi-DenseNet-CTC 文本序列识别算法和 SCTDNet识别算法识别商品的条形码、文本序列和整体特征,并将结果输入随机森林商品特征分类器中进行分类识别,通过计算每个输入特征的预算分数,输出最优识别结果,最后通过商品画像库进行信息匹配,实现高效商品检测识别。在公共数据集RPC中,本文算法的商品识别准确率mAP50达到96.95%。在自制商品图像数据集中,本文算法相比原始的Retinanet算法、改进的Retinanet算法,商品识别准确率分别提高了6.11%和2.48%,达到97.81%;平均检测时间缩短至0.18s,检测速率分别提升了 33.33%和 18.18%,能较好的实现商品的快速识别。
实验证明,本文在公共数据集和自制商品图像数据集中均取得了较好的效果,验证了算法的有效性和可行性。
针对超市商品种类繁多且商品特征存在局部性等特点,本文从应用场景出发,利用左、上、右不同方位摄像头采集传送带上商品不同面图像,引用基于相位相关和纹理分类的 SIFT 图像拼接算法对商品图像进行拼接处理,并通过图像检测算法检测商品的敏感特征和整体特征,最后利用基于随机森林的多特征融合商品识别算法实现商品的快速识别。
本文主要研究内容包括以下三个方面。
(1)针对Retinanet网络模型检测精度低、速度慢等缺点,提出了基于改进Retinanet的图像检测算法。该算法首先利用信息交互融合技术和改进的特征金字塔提取图像纹理特征及高频抽象特征,然后引用SSH检测网络代替原网络模型中的分类回归子网络,以扩大图像检测面积,最后利用加权损失进行回归,以提升图像检测效率。在RPC数据集中,相较于原始的Retinanet网络模型,本文算法的检测准确率提升了3.90%,达到96.69%;单张图像的平均检测时间由0.201s降低至0.145s,检测速率提升了27.86%。
(2)针对商品外包装包含条形码、文本序列等高可信特征,提出了基于T-Densenet条形码检测算法和Wh-CTPN文本序列检测算法。基于T-Densenet 条形码检测算法通过增加Densenet网络层,并且重新调整anchor值以增大条形码覆盖面积,进而准确、快速地检测商品的条形码特征。Wh-CTPN文本序列检测算法通过对CTPN算法中的Side-refinement 公式重新进行定义实现文本序列信息的准确定位,进而提取出商品的商标、规格、文字描述等重要文本信息。
(3)针对商品特征的多样性,提出了基于随机森林的多特征融合商品识别算法。该算法利用 Zbar 条形码识别算法、Simi-DenseNet-CTC 文本序列识别算法和 SCTDNet识别算法识别商品的条形码、文本序列和整体特征,并将结果输入随机森林商品特征分类器中进行分类识别,通过计算每个输入特征的预算分数,输出最优识别结果,最后通过商品画像库进行信息匹配,实现高效商品检测识别。在公共数据集RPC中,本文算法的商品识别准确率mAP50达到96.95%。在自制商品图像数据集中,本文算法相比原始的Retinanet算法、改进的Retinanet算法,商品识别准确率分别提高了6.11%和2.48%,达到97.81%;平均检测时间缩短至0.18s,检测速率分别提升了 33.33%和 18.18%,能较好的实现商品的快速识别。
实验证明,本文在公共数据集和自制商品图像数据集中均取得了较好的效果,验证了算法的有效性和可行性。