论文部分内容阅读
自深度学习用于图像的目标识别与检测领域取得了突破性的进展后,便成为了目标检测中最流行的方法,越来越多的基于深度学习的目标检测框架被提出,并且被工业化的应用在了各种领域。将目标检测和识别的技术引入水泥电子扫描显微镜(SEM)图像中,借助计算机科学的手段对水泥SEM图像进行分析。本文根据卷积神经网络在水泥电镜图像目标检测中的应用研究的研究课题,选取Faster R-CNN目标检测框架对水泥SEM图像进行检测,针对水泥SEM图像中的水化产物和孔隙尺寸差异较大且互相重叠的特性,通过对Faster R-CNN的进行改进,提升其检测精度,为后续的水泥微观结构的研究提供思路和方法。本文所做的主要工作如下:针对本文中水泥SEM图像数据集过小的问题,分析各卷积神经网络的特点,提出一种使用DenseNet来进行卷积层的特征提取的Faster R-CNN目标检测模型,DenseNet相对于其他卷积神经网络具有较好的抗过拟合能力和泛化性能,能够有效地在水泥SEM图像提取特征,减少过拟合。实验表明,该方法相对于基于常用的卷积神经网络的Faster R-CNN目标检测模型,mAP得到了一定的提升。其次,针对本文的目标检测任务中的各个目标之间尺寸差异较大的问题,本文提出一种自适应性的锚宽尺寸设计方法,对水泥SEM图像目标样本中的目标的长宽进行归一化之后,再使用聚类方法进行聚类分析,通过目标边界框的交并比的大小作为聚类分析的距离进行聚类,同时对目标边界框的面积进行统计分析,得到新的锚宽的尺寸和比例作为RPN中的参数,提高了目标检测的准确率,减少因默认的锚宽尺度导致的漏检。针对水泥SEM图像中部分目标过小,部分目标交叠,进而导致漏检的问题,本文在Faster R-CNN中引入ROI Align,ROI Align能够减小特征提取时因为量化对于小目标的影响。总体来说,本文通过对目前目标检测框架中精度较高的Faster R-CNN进行了一定的改进后,将其在水泥SEM图像中进行了水化产物和孔隙的检测。实验结果表明使用本文的方法改进之后的Faster R-CNN目标检测模型能够对水泥SEM图像中的目标进行检测,并且相比于未改进之前的使用VGGNet为进行特征提取的Faster R-CNN提高了8.93%的mAP。