基于视觉注意机制的图像分割算法研究及其应用

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:abcdefg1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在图像分析和处理中,人们往往只对图像中的某些部分感兴趣,这些部分通常称为目标或前景,一般对应于图像中具有特定性质的区域。图像分割就是将一幅图像划分成若干个互不相交的区域,从而将目标从复杂的场景中提取出来的技术。图像分割的结果是图像特征提取和识别等图像理解的基础,在计算机视觉、遥感乃至军事工程等领域都有着广泛的应用。基于图论的GrabCut算法是效果很好的图像分割算法,但是需要用户手工进行初始区域的框选操作,且初始区域的选择直接影响到图像分割的准确性。本文提出了一种基于视觉注意机制的GrabCut图像分割方法(VA-GrabCut),解决了原始GrabCut算法依赖于人工交互的问题。首先,使用视觉注意机制生成图像的显著图作为分割的初始候选区域,代替手工框选操作。然后结合GrabCut算法完成图像的精确分割。在算法中通过选取最大连通区域以获取更准确的目标区域,并利用边缘补偿优化操作避免了过分割现象。最后使用真实场景图片与虚拟场景图片对算法效果进行了验证,结果表明VA-GrabCut算法具有良好的分割效果。结合图像特征及神经网络原理,提出了一种基于AlexNet的深度卷积神经网络作为可训练的图像特征提取与分类器,对图像中的目标进行识别。在网络设计中对输出端的Softmax分类器进行了修改,使其可以对仿真所需的飞机、导弹、坦克、汽车以及行人5类目标物体进行分类识别。将VA-GrabCut算法提取的目标区域作为训练及测试集,在Caffe平台上对修改后的网络进行了试验。实验结果表明,通过微调训练后的网络对上述5类目标图像识别的平均准确率达到了71.9%。基于深度卷积神经网络对图像识别的结果,结合红外热辐射特性理论生成了5类目标在不同波段下的红外模拟图像。首先对目标所在场景进行红外辐射建模,依据图像标识结果,赋予不同类别目标物体相应的红外辐射参数。然后,根据预设环境数据,分别计算出每一类目标物体在近红外、中红外以及远红外3个波段下的总体辐射出射度。最后,经过灰度转换生成相应波段的仿真红外图像。本文通过基于视觉注意机制的VA-GrabCut算法自动分割出目标区域,然后利用卷积神经网络对目标图像进行识别,最后根据目标的材质对识别出的目标进行红外图像仿真,为图像分割以及红外图像仿真的研究提供了较好的参考价值。
其他文献
黑片作为工业应用中重要的元器件,如何降低其产品质量检测的费用,提高检测效率,成为黑片缺陷检测的重要内容。然而黑片图像在采集和传输等过程中不可避免会受到各种噪声的干
随着计算机技术的不断发展,软件的规模越来越大,软件测试的作用越来越重要。对于测试数据自动化生成方法,目前虽然有一些方法被提出并使用,但由于其局限性,在实际中还没有完
人脸表情识别是一个涉及到模式识别、图像处理、人工智能等多学科的综合课题。所谓人脸表情识别是让计算机对人脸的表情信息进行特征提取分析,结合人类所具有的表情信息方面
近几年计算机网络发展呈现出从集中模式向分散自治模式发展的趋势,转变为可公共访问的,面向大量动态用户的开放网络。针对开放网络中传统安全技术难以解决的用户行为约束问题,学
BGP作为互联网的基础设施,提供了自治系统间的通信机制,在互联网运行中起着重要的作用。配置错误、设备故障、网络攻击等问题都能对BGP路由系统产生重大影响,进而危害整个互联网
无线传感器网络(Wireless Sensor Network,WSN)是由大量部署在监测区域内的具有数据采集、信息处理、无线通信等功能的微型传感器节点形成的自组织网络系统,是一种全新的信息获取
视景仿真是虚拟现实技术在实际应中的热门研究课题之一,其中包括对火焰、云雾、雨雪、沙尘、浪花等动态自然景物和现象的模拟与绘制,在气象预报、航空航天、装潢广告等领域有
人脸识别技术因其具有重要的科学意义和实用价值,在近几年得到了研究者的高度重视,成为当前模式识别和人工智能领域的一个研究热点。人脸识别主要分为人脸检测、特征提取和模
随着计算机技术和网络技术的飞速发展,计算机网络在人类社会各领域发挥着越来越重要的作用。由于自身存在的漏洞,计算机网络在给人们的生产生活带来便利的同时,也给网络攻击
现在的Web(万维网)已经成为传统Web信息与语义网(Semantic Web)信息共存和交融的信息空间。近年来,这两种类型的信息都得到了爆炸式的增长。如何从这个海量的、异质的信息空间中快