论文部分内容阅读
目标识别技术在人工智能领域是一项重要课题,已广泛应用到医学、机器人视觉、智能交通、遥感等方面。在机器人视觉中,要求目标识别技术具有高精度、实时性与实用性,要求能够适应现场恶劣的噪声环境。本文使用改进的CNN框架实现对Caltech数据集和自建办公用品数据集的分类识别,分析经典算法与本文提出方法的优劣性,结合改进的CNN框架与小波自适应阈值降噪的方法构建智能办公机器人目标识别系统。本文提出三种目标识别方法:针对传统分类方法对大规模图像集识别时间长、效率低的问题,引入经典框架,提出一种基于AlexNet激活函数层特征提取的目标识别方法。主要思路是训练AlexNet模型,选取已训练模型的ReLU激活函数层进行特征提取,将特征向量送入多分类支持向量机进行训练与识别。实验结果表明,该方法与经典AlexNet框架相比识别率有明显提高,与选取全连接层作为特征提取层的方法相比有明显提高。针对CNN框架的ReLU激活函数梯度死亡导致识别精度低的问题,引入LeakyReLU与PReLU激活函数,提出基于LeakyReLU与PReLU激活函数改进的CNN框架。LeakyReLU与PReLU激活函数相结合对负值数据进行加权并构建PL-ActNet,提出基于PL-ActNet的激活函数层特征提取的目标识别方法,实验结果表明,该框架对负值数据进行加权优化,有效提高了识别精度。针对机器人目标识别系统实时采集图像时受到噪声环境影响的问题,引入了小波自适应阈值降噪的方法,选取不同小波函数和阈值函数对图像降噪。提出了基于小波自适应阈值降噪的目标识别,该方法综合上述工作,进一步增加识别精度和鲁棒性。实验结果表明该降噪方法解决了硬阈值的不连续性和软阈值分解重组图像产生的固定偏差问题,有效提高了图像质量和目标识别精度。本文方法在Caltech101数据集正确率达到88.91%,在自建办公用品数据集中正确率达到96.67%。本文对于目标识别技术的研究有重要贡献。