论文部分内容阅读
行人检测在辅助驾驶、交通控制、安全监护等领域的有着广泛应用,过去20十年中,行人检测成为计算机视觉和机器学习领域中的热门研究课题。现在智能汽车希望有检测和跟踪行人的保护功能以防止或减少交通事故的发生。尽管目前已有很多研究机构提出了各种不同的行人检测系统,但很多都不能做到实时检测。此外,还有一些共同的问题,如遮挡、背景重叠、光照变化、行人姿态的变化等。本文目的是设计快速、鲁棒的行人检测模型,通过从数据中学习表示模式,达到有效将他们分类的目标(行人和非行人)。本博士论文主要工作如下:1):提出了一种基于兴趣区域法来检测行人。该方法具有计算量低,检测速度快的特性。因良好的效果,滑动窗口法在行人检测中广泛应用。滑动窗口法考虑所有可能的子窗口,然后通过分类器去判别决定其是否为行人。对一幅大场景图来说,搜索所有可能的的子窗口的计算量非常巨大。巨大的计算量导致无法做到实时,因此搜索区域必须减少。但是,兴趣区域则会减少检测子窗口数量。2),本文提出了多块局部二进制描述子用着行人检测。该描述子表示局部邻域的外观和行人目标的细节,在固定分辨率下获得的特征模式,组合得到高维特征。该描述子对光照变化、颜色和方向旋转等有很强的鲁棒性和很好的判别能力。好的检测结果是基于局部邻域的。为了使得行人描述子更加鲁棒,本文提出了稀疏多块局部二进制模式。3)构造了一个级联分类器,该分类器能处理重要的信息。尽管现有自适应迭代算法,神经网络和支持向量机等分类器,但他们都不能做到实时检测,导致很长的处理时间。本论文,提出了级联改进的费歇判别分类器,它兼具准确和快速性。最后,提出了一个基于增强部分表示的方法用于行人检测,该方法首先检测行人的局部,比如说,头、脚,然后将其融合得到整个人的检测结果。为了测试特征集,提出了一个相对简单的学习框架去判断每个可能的区域是为行人或非行人。此论文以图像或视频中的行人检测为中心,可以应用于智能汽车、视频监控。实验结果表明该方法达到了很好的实验效果。