论文部分内容阅读
二十一世纪人类进入了人工智能社会,机器人、语言识别技术、图像识别等智能化工具与技术的出现便利了人们的工作与生活,使得人们脱离了繁重和重复性的工作。目前,人工智能技术已经用于到了很多行业,应用范围广泛但是技术的应用的深度尚浅,一方面是技术与实际应用的结合尚未完全到位,另一方面是人工智能顶层的知识尚需学术科研界的进一步完善。本文主要针对两方面的工作进行了研究:行人检测和三维重建。行人检测是智能安防领域的核心问题,对人员的检测与定位是行为识别的基础;三维重建技术获取场景的三维空间信息,能够更好地理解场景,也是如今虚拟现实、增强现实的基础。针对目标检测,本文首先使用传统的基于的背景的目标检测,实现目标的检测与跟踪,但存在噪声影响较大、目标信息缺失的问题。并且传统方法无法进行准确定位。本文使用经典的梯度方向直方图特征与边界二进制直方图特征,结合分类器支持向量机与随机森林对目标与非目标进行分类,在本地的数据集上,梯度方向直方图特征能较好的实现检测,但是边界二进制直方图特征被证明是一种不能良好描述人体的特征。在深度学习中,本文基于卷积神经网络深度学习框架,对样本进行训练测试,实际的效果并不太理想,最终检测的效果与实际的样本数据集的分布有关。基于传统背景-目标检测无法准确定位,基于特征的目标检测存在检测漏检误检且检测耗时的情况。本文提出了一种基于混合高斯背景建立背景模型,提取前景目标坐标点,最后基于K均值聚类算法对目标进行聚类获取聚类中心来确定目标的位置该方法能够实现对图像的实时处理,所有的目标都能被检测出来,检测速度快,能够进一步滤波的作用,实际运行的效果良好。方法也存在检测出的目标的数量多于实际存在的目标的问题。本文提出基于目标数量上限下限优化聚类中心个数,实现目标个数的优化确定。聚类检测与特征分类器结合识别目标,大大减少了待检区域范围,文章进一步分析了特征-分类器方法、背景特征分类器方法,聚类检测方法时间消耗以及优缺点。针对三维重建,本文采用棋盘标定方法对单摄像机、双目摄像机进行标定,数据集基于开源计算机视觉库,基于两个摄像机拍摄得到的图像建立三维场景,获取不同视角下的三维信息。