论文部分内容阅读
行人检测技术是机器视觉的一个重点研究领域,由于其广泛的应用价值成为研究的热点。同时,由于行人自身的非刚性特点与所处环境的复杂性,使得行人检测又是一个研究的难点。近年来深度学习方法的兴起促进了人工智能的发展,相应地带动了行人检测技术的迅猛发展。 文中从行人检测方法的基础理论出发,介绍了几种主流的机器学习方法,以及行人检测中常用的几类特征提取方法。当前应用深度学习进行行人检测的研究,存在深度学习的局部最优问题,检测效率不够,且采用深度学习生成高效分类器时需要较高的技巧。为克服以上问题,本文提出运用Adaboost框架算法实现深度学习的集成,其中运用深度自动编码器、深度信念网络、深度卷积网络作为子分类器的基础分类器类型。首先,我们在小规模数据集(USPS手写体)对深度学习的集成框架进行了原始图像数据的多分类验证。对于行人检测问题,由于其数据量规模较大以及环境的复杂性,运用了常用的几类特征提取方法实现了数据信息的预提取,搭配不同类型的深度学习方法,充分发挥深度学习方法的自学习特征这一优点,加大了Adaboost框架下的子分类器互异性。另外,在网络设计中加入稀疏神经元、随机噪声干扰等操作,减小同一类型网络生成时的相似性,进一步加大了Adaboost集成框架中各子分类器(深度神经网络算法)的良性互补。手写体识别的多分类实验以及不同分类方法下 INRIA数据集和 MIT数据集下的行人检测对比实验表明,本文所提出的方法有效的提升了算法的泛化性和准确率。 最后,本文设计了静态与动态行人检测系统,并运用到真实场景中。从检测结果可以看出,本文算法具有很好的行人检测效果。