基于双目立体视觉的立体匹配算法的研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:dorothyhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双目立体视觉技术是当前计算机视觉领域的专家和学者的一个热门的研究课题。它的原理是模拟人类的双目视觉系统从二维图像信息中感知三维图像信息。双目立体视觉系统通常采用数码摄像机和计算机等作为外设工具,在图像采集根据一定的约束条件获取图像,利用立体匹配原理对采集到的图像进行信息提取整合,最终获得三维立体图像。双目立体视觉技术在军事化战争、工业检测、医学影像、监控系统、机器人视觉导航和影视娱乐等方面都有非常广泛的应用背景。立体匹配则是双目立体视觉系统中比较关键和困难的部分,著名的专家和学者已经对立体匹配问题深入研究了多年,而它本身是一个“病态”的问题,至今为止尚未找到合适的算法很好的解决匹配中存在的问题。尽管人们对立体匹配等相关问题已经研究多年,但是各种立体匹配算法仍存在一些共同的缺点,例如得到的视差图边缘模糊、对视差图中存在的遮挡区域、弱纹理或无纹理区域的匹配出现歧义等。本文首先对选题的背景和主要内容及立体视觉国内外的研究现状进行了研究,详细研究了立体视觉技术的理论基础(包括双目视觉原理、摄像机标定常见的几种方法)、研究内容和研究现状等。其次,对立体匹配算法的分类、双目立体视觉匹配系统的存在的问题(包括匹配基元的选择、匹配准则、双目立体视觉系统的算法结构等)、立体匹配算法的计算步骤(包括匹配代价的计算、匹配代价的叠加、视差获取和视差修正)进行了详细的分析,对匹配算法的评价及当前面临的挑战进行了综合性研究。第三,本文对常见的两种图像分割算法(均值漂移算法和分水岭算法)原理进行了深入的研究。均值漂移(Mean shift)是一种有效的统计迭代估计算法,它使图像中每一个像素点都移动到密度分布函数的局部极大值点处,对于彩色图像它能够利用像素点的颜色空间模式信息进行对像素点进行分类聚集。分水岭算法是一种拓扑理论的数学形态的分割方法,它把局部灰度最小值看作盆地的最低处,灰度最大值处看作山脊,模拟盆地淹没的过程对图像进行分割。对于两种算法用MATLAB和VC++6.0工具做实验进行比较,结果表明均值偏移算法具有更好地图像分割效果。第四,本文对Andreas Klaus发表的Segment-Based Stereo Matching Using BeliefPropagation and a Self-Adapting Dissimilarity Measure中所提出的算法进行了详细的研究,算法对参考图像中具有相同颜色的区域进行分段,用基于窗口的局部匹配方法来确定像素点视差的可信度,采用平面几何方法获得视差平面标记集合图像,最后对视差平面场进行优化,得到最终视差图。本文对该算法进行了改进。一,对该算法中的绝对值梯度差的计算公式增加了深度z方向。二,引入HOG算子,对图像中的遮挡检测有比较好的效果。实验结果表明,改进后的算法在图像的误匹配像素方面具有更好地效果,减少了图像的误匹配像素点,结果更接近于真实视差图。最后,本论文的完成对后续立体匹配算法的研究提供了支持。
其他文献
随着经济社会的快速发展,人们对信息化、智能化的需求日益增加,传统人工监视的方法已经很难满足监控要求,因此智能监控技术应运而生。智能监控是在无人为管理的情况下,利用计算机
自1969年互联网诞生到2011年互联网被广泛应用到社会的各个领域,流经互联网的数据量至少膨胀了200亿倍,并且这些数据每天都会以更快、更大规模的趋势增加。为了将每天产生的
互联网的蓬勃发展,引领了社会信息化的新潮流,创造了人类社会交流的新空间,给人类的生产生活带来了巨大的影响与改变。然而,当今社会仍然有相当一部分特殊人群,如视力残疾、
对于无线传感器网络来说,其研究的重要技术之一就是获取网络节点的位置信息。随着该网络应用的普及,对其的研究也逐渐从静态网络转向动态网络。动态的传感器网络定位技术成为
基于Web的地理信息系统已经成为一种大众化的信息工具,它是地理信息系统与因特网技术的有机结合。现有的很多基于Web的地理信息系统使用的都是栅格数据,在放大级别和复杂查询上
近几年来,随着多媒体处理技术的日趋成熟以及人们安全意识的不断提高,视频监控系统在社会生活的各个方面都得到了广泛的应用。人是社会的主体,监控系统的作用主要是实现对人
图像配准是将不同传感器在不同时间或不同成像条件下对同一景物获得的两幅或多幅图像在空间上对准,是图像处理的基本问题之一。配准效果将对图像拼接、图像识别、目标跟踪等后
随着海量网络信息的积累和规模的高速增长,准确快捷地找到自己所需要的信息已成为人们迫切的需求。自动问答系统,通过理解用户自然语言形式的问句,返回答案或包含答案的文本
随着计算技术和图像处理技术的发展,嵌入式系统技术和网络视频应用技术结合的嵌入式网络视频应用逐步普及。但是由于嵌入式系统对处理资源的限制,以及网络视频应用对处理资源
文物数字化展示是文物保护和可持续发展的关键环节,而文物模型具有的大数据量的特点决定了其三维实时展示的困难。如何在有限硬件条件下实现文物模型良好的展示效果,是本文的