论文部分内容阅读
随着电子商务的发展,网络交易的数量急剧增加,导致大量的包裹需要收发、分拣和运输。由于包裹数量巨大,利用机器进行自动分拣的需求强烈。机器自动分拣过程中,图像采集装置获取运动包裹的图像,采用图像处理和识别技术提取包裹图像上的表单,并识别其中条码、收件人地址、收件人手机号码等信息,为自动分拣提供依据,从包裹图像提取表单内容是技术难点之一。本文提出了一种基于图像配准的包裹表单内容提取方法,用于提取表单中填写的内容,即去掉表单中的表格、线条、商标、预先打印的“收件人地址”字样等格式化的内容并将表单图像做归一化处理,从而便于识别表单中填写的内容。本文的主要工作包括:一、提出一种通过最大团综合图像块间几何关系与SIFT特征描述子间相似性的方式来匹配控制点对的方法。在表单图像存在分辨率、亮度、方向、旋转角度、尺度等方面的差异时,能够求得较为准确的变换模型;二、提出一种图像相减操作,在相减前先对两幅图像进行光照调整以应对图像采集时的光照差异,在相减时为对应像素计算一定范围内最恰当的灰度值,以适应非完全精确配准的情况,在相减后根据差异图像确定模板图像,最终根据模板图像与输入的表单图像确定表单中填写的内容,取得了较好的效果。本文方法在SRI-PARCEL1数据集上进行了测试。SRI-PARCEL1数据集中的图像为中国邮政实际使用中的分拣机采集的包裹表单图像,本文提出的方法在该数据集上取得了较好的效果。