基于模式识别的双目立体视觉匹配研究

来源 :武汉大学 | 被引量 : 28次 | 上传用户：xiaoliang668

【摘要】

：

随着科技的飞速发展,机器视觉相关应用在国民生活中扮演越来越多、越来越重要的角色,例如安防监控、机器人导航、三维数字虚拟现实等。人们对机器视觉的要求也越来越高,现阶

【作者】

：

彭祺

【出处】

：

武汉大学

【发表日期】

：

2013年01期

【关键词】

：

立体匹配仿射不变约束 K均值聚类模糊识别视差传递动态规划阴影剔除

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着科技的飞速发展,机器视觉相关应用在国民生活中扮演越来越多、越来越重要的角色,例如安防监控、机器人导航、三维数字虚拟现实等。人们对机器视觉的要求也越来越高,现阶段许多机器视觉应用正从二维可视化向三维可视化发展。双目立体视觉系统作为最接近于人类视觉结构特征的三维图像系统,是现阶段机器视觉的研究热点。双目立体视觉系统模拟人类视觉系统,通过左右两幅二维图像恢复出三维图形,立体匹配技术是该过程中十分重要,且十分困难的一个关键步骤。立体匹配的本质是参照某幅图像,在另一幅图像中搜索对应同名点。自然世界的图像十分复杂,某些特殊场景图像甚至让最高智能的人类视觉系统产生错觉,要求计算机对各种复杂图像正确分析,搜索到相对应的同名点是一项极具挑战的工作。本文的工作即围绕双目立体匹配这一任务展开。有关双目立体匹配的研究已进行数十年,从最初基于极限约束的特征搜索,到后来马尔科夫随机场优化理论的应用,再到图像分割算法的应用,到现阶段最新的并行算法引入,双目立体匹配的研究遵照Marr提出的视觉理论框架从底层处理向高层图像理解进发。图像弱纹理区域、遮挡区域的匹配一直以来是双目立体匹配的难点。双目立体匹配技术若要应用于生产生活的各个方面,必须能处理各种复杂的自然场景,而且要保证一定的计算效率。传统的图像处理方法在这些问题的处理上已遭遇瓶颈,要想获得新的突破,必须向高层的图像理解进发,运用人工智能模式识别的方式进行立体匹配。将模式识别有关理论与技术方法引入双目立体匹配,是本文所做研究工作的重点。本文主要的研究工作和创新成果如下：(1)本文在第一章对现阶段立体匹配领域的5类主流算法分别进行比较和讨论,对现阶段立体匹配算法所面临的问题与难点进行了讨论。在第二章介绍了双目立体视觉的原理和立体匹配算法的分类,并详细讨论了模式识别中的部分理论与双目立体视觉匹配的关系。(2)近几年图像采集设备的发展十分迅猛,人们能轻而易举地获得高清晰度的图像和视频,但这些高分辨图像给计算机处理带来巨大挑战。几年前,基于MRF理论的部分立体匹配算法,计算一张450x375分辨率的图像耗时十几分钟,而现在普通相机获取的图像分辨率高达6000×4000像素,依照传统方法对该立体像对进行匹配,计算时间过长,失去实用价值。本文第三章围绕该问题进行深入研究,提出一种基于仿射不变收敛三角形的约束方法进行立体匹配。该方法对于室外大场景具有较高精度,对于视差变化剧烈的复杂场景,通过点群分组的方法对区域进行识别匹配,对遮挡处理具有良好的效果。该算法基于仿射不变几何约束,与像素点自身属性无关,因此计算速度很快,在毫秒量级。(3)高可靠性的匹配点对,即广义地面控制点GGCP,在立体匹配过程中发挥十分重要的作用。如何自动获得高可靠性的GGCP点,成为本文第四章第一节的研究内容。在该章节中,提出基于不同深度面元特征点K均值聚类算法,对初始获取的SURF特征匹配点对进行筛选剔除,保留符合条件约束的特征点对。该算法相对于传统特征点匹配算法,充分考虑空间对象目标物深度约束的特点,鲁棒性地对二维图像中的点进行聚类,获取高可靠性的GGCP点。(4)对于弱纹理图像,基于图像分割的立体匹配算法有许多其它算法所不具备的优良特性,但基于图像分割的立体匹配算法严重依赖分割效果,且在后续匹配步骤中很难修正图像分割算法带来的误差。对于该问题,本文第四章第二节进行详细的研究,引入模式识别中的模糊理论,将单个“无意义”的像素点归属到语义较为丰富的线基元和面基元当中。对整个面基元进行区域匹配,能有效克服图像弱纹理区域带来的不利影响,特别有益的是,线基元和面基元在后续的匹配计算中还可以进行修正,避免基元提取和匹配误差造成后续匹配步骤难以修正的错误。(5)稠密立体匹配一般需要较长的运算时间,经研究发现造成运算时间较长的原因是对每个像素进行视差轮询所致。本文第四章第三节运用句法模式识别的思想,将复杂场景图像构建为层次化的模式关系,运用多维矩阵表达复杂的数据结构,提出点线跳跃视差传递算法,并引入动态规划理论分步生成视差图。该方法相对于传统方法具有一定的“智能”,它首先将复杂场景识别为语义信息丰富的基元,然后依据基元特征进行匹配。该方法运算速度较快,对不同场景适应性较好。(6)运动目标的阴影识别与剔除,一直以来是运动目标跟踪与定位领域的难点。本文第五章,运用双目立体视觉系统及其理论,分别对室外与室内的运动目标投射阴影进行剔除,获得良好的效果。本文提出的所有匹配算法均遵照人工智能模式识别的思想,对运算速度严格要求,充分保证所提出的算法具有实用性。

其他文献

弘扬东北抗联精神提升高校学生思想政治教育新高度

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

东北抗联精神大学生思想政治教育教学策略

中国地方债信用评级方法改进研究

本文在回顾了我国地方政府市政债发展的历史和现状的基础上,通过对我国市政债发展现状的研究,梳理市政债发展的历史脉络和原因,研究财政分权制度的影响以及主要存在的问题,并

学位

地方政府债务违约风险信用评级房地产价格

基于微纳层叠的PET/PA6双向拉伸薄膜的制备与性能研究

期刊

聚对苯二甲酸乙二醇酯尼龙6微纳层叠挤出双向拉伸力学性能阻透性能

我国网民现状调查分析

[摘要] 近年来，随着我国社会经济的快速发展和互联网产业的崛起，我国已经成为世界上网民数量最多的国家。受我国国情的影响，与发达国家相比，我国网民普遍存在素质不高，收入低，网络消费不成熟等特点。　　[关键词] 网民网络信息消费　　　　虽然在互联网发展上起步较晚，但我国却发挥出后发优势，利用13年左右的时间不仅完成了从无到有的发展历程，网民数、宽带用户数更跃居全球首位，在我们丰富的汉语言中增加了一

期刊

网民网络信息消费

以双一流建设为抓手,推进军民深度融合育人模式

本文通过对军民融合纳入高校"双一流"建设存在的障碍分析,发现体系分割、军民分离格局尚未完全打破、科技成果军民双向转化不畅等是影响高等教育与军民融合协同创新体系的重

期刊

双一流军民融合高校

研究生学历幼儿教师自主专业发展的个案研究

随着幼儿教育日益受到全世界的高度重视,幼儿教师成为一种专门职业,向着专业化的方向发展。对教师专业发展研究的关注点也逐渐从群体到个体,从外在被动到内在主动发展的转变,

学位

研究生学历幼儿教师教师专业发展自主专业发展个案研究

B2C电子商务网站的设计与构建

[摘要] 本文介绍了基于Internet的一个B2C电子商务网站的设计思路。　　[关键词] Internet ASP 电子商务数据库购物网站　　　　一、引言　　电子商务网站是企业开展电子商务的基础设施和信息平台,是实施电子商务的公司或商家与服务之间的交互界面,是电子商务运转的承担者和表现者。电子商务网站是以实现企业的业务功能为主要目的,设计与实现既定的业务功能是成功构建电子商务网站的关键所在

期刊

INTERNETASP电子商务数据库购物网站

基于碳量子点与曙红Y荧光共振能量的转移测定矿石中金

在聚乙烯醇存在下的pH6．6磷酸氢二钠--柠檬酸钠缓冲溶液中，碳量子点与曙红Y（EY）的荧光共振能量转移，使EY的荧光增强。在该体系中，碳量子点作为能量供体，EY作为能量受体。当加入Au^3＋

期刊

碳量子点曙红Y荧光共振能量转移矿石金

米老排的研究进展及其开发利用前景

米老排（Mytilaga laosensis Lecomte）属金缕梅科（Hamamelidaceae）壳菜果属（Mytilaria）常绿阔叶乔木，天然分布于我国广东、广西、云南及东南亚等地，是一种优良速生用材树种。文章综述

期刊

米老排特性开发利用

基于模式识别的双目立体视觉匹配研究

其他学术论文