论文部分内容阅读
随着计算机视觉的发展,图像采集与数字图像处理成为了目前行人检测的主流方式。由于行人目标和应用场景具有多样化的特点,现有行人检测系统的精度与实时性不断受到挑战。本文针对狭窄区域的俯视行人场景,研究立体匹配与行人检测跟踪算法,结合CUDA并行计算技术,构建实时的双目行人检测系统方案,具有很强的学术价值与实际意义。在俯视行人检测场景中,深度信息是判别行人的重要依据。对于双目视觉系统,立体匹配是视差获取过程中最重要的步骤,其精度与算法复杂度成正比。受制于实时性的要求,常规的算法难以获得较高的精度。本文针对已有的局部立体匹配算法提出改进,使用基于自适应权重的代价聚合算法提高立体匹配的精度。为了缩短立体匹配的计算时间,本文在GPU计算平台下,使用CUDA架构实现算法,并引入了 coarse-to-fine的思想,对自适应权重算法进行改进。实验结果表明,使用该算法处理192*144的图像耗时25ms,能够满足一般视频处理的需求。在Middlebury测试中,本文改进的算法排名102,与原来的自适应权重算法相比,两者精度相近,运算时间仅有改进前的一半。为了提高行人检测的准确程度,本文充分考虑了场景原图像与所得视差图像中的有用信息,提取其中的运动特征、形状特征、深度特征作为行人判定的依据。这样的目标判定方法能够在不产生漏检和误检的情况下,准确地得出行人头部位置的坐标。为了进一步得到场景中多个行人的轨迹信息,本文在目标跟踪环节加入了 Kalman预测算法,有效提高了目标跟踪的准确率。最后,本文构建了图像采集系统与异构计算平台。针对使用CUDA计算的立体匹配,本文通过性能测试确定了瓶颈所在,并通过优化提高了 GPU的占用率与数据传输效率。考虑到各主要计算任务的耗时和依赖性关系,本文提出了一种异构计算平台下的视频处理改进方法,改进后的处理能够充分利用CPU与GPU的计算资源,在较短时间内完成行人检测的所有计算任务。在室内环境与工业电梯人数统计实验中,本文方法的正确率分别达到了 96%与88%。因此,本系统具有较高的准确率与较强的鲁棒性。最后,本文对所开展的研究工作进行了总结,并展望了下一步的研究工作。