论文部分内容阅读
双目立体视觉技术是当前计算机视觉领域的专家和学者的一个热门的研究课题。它的原理是模拟人类的双目视觉系统从二维图像信息中感知三维图像信息。双目立体视觉系统通常采用数码摄像机和计算机等作为外设工具,在图像采集根据一定的约束条件获取图像,利用立体匹配原理对采集到的图像进行信息提取整合,最终获得三维立体图像。双目立体视觉技术在军事化战争、工业检测、医学影像、监控系统、机器人视觉导航和影视娱乐等方面都有非常广泛的应用背景。立体匹配则是双目立体视觉系统中比较关键和困难的部分,著名的专家和学者已经对立体匹配问题深入研究了多年,而它本身是一个“病态”的问题,至今为止尚未找到合适的算法很好的解决匹配中存在的问题。尽管人们对立体匹配等相关问题已经研究多年,但是各种立体匹配算法仍存在一些共同的缺点,例如得到的视差图边缘模糊、对视差图中存在的遮挡区域、弱纹理或无纹理区域的匹配出现歧义等。本文首先对选题的背景和主要内容及立体视觉国内外的研究现状进行了研究,详细研究了立体视觉技术的理论基础(包括双目视觉原理、摄像机标定常见的几种方法)、研究内容和研究现状等。其次,对立体匹配算法的分类、双目立体视觉匹配系统的存在的问题(包括匹配基元的选择、匹配准则、双目立体视觉系统的算法结构等)、立体匹配算法的计算步骤(包括匹配代价的计算、匹配代价的叠加、视差获取和视差修正)进行了详细的分析,对匹配算法的评价及当前面临的挑战进行了综合性研究。第三,本文对常见的两种图像分割算法(均值漂移算法和分水岭算法)原理进行了深入的研究。均值漂移(Mean shift)是一种有效的统计迭代估计算法,它使图像中每一个像素点都移动到密度分布函数的局部极大值点处,对于彩色图像它能够利用像素点的颜色空间模式信息进行对像素点进行分类聚集。分水岭算法是一种拓扑理论的数学形态的分割方法,它把局部灰度最小值看作盆地的最低处,灰度最大值处看作山脊,模拟盆地淹没的过程对图像进行分割。对于两种算法用MATLAB和VC++6.0工具做实验进行比较,结果表明均值偏移算法具有更好地图像分割效果。第四,本文对Andreas Klaus发表的Segment-Based Stereo Matching Using BeliefPropagation and a Self-Adapting Dissimilarity Measure中所提出的算法进行了详细的研究,算法对参考图像中具有相同颜色的区域进行分段,用基于窗口的局部匹配方法来确定像素点视差的可信度,采用平面几何方法获得视差平面标记集合图像,最后对视差平面场进行优化,得到最终视差图。本文对该算法进行了改进。一,对该算法中的绝对值梯度差的计算公式增加了深度z方向。二,引入HOG算子,对图像中的遮挡检测有比较好的效果。实验结果表明,改进后的算法在图像的误匹配像素方面具有更好地效果,减少了图像的误匹配像素点,结果更接近于真实视差图。最后,本论文的完成对后续立体匹配算法的研究提供了支持。