静止图像的ROI区域自动提取与编码

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:sgjies
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的不断发展和人们对于信息通信智能化的需求,近年来感兴趣区域提取与编码技术成为学者们研究的热点之一。感兴趣区域提取技术是图像内容差异性编码及视频图像智能分析的基础,对于基于语义的图像检索、智能视频行为分析、远程医学图像诊断具有重大的应用价值。感兴趣区域编码技术即优先对感兴趣区域并有别于非感兴趣区域的编码技术,在带宽有限制条件下显得尤为重要。图像感兴趣区域的提取和编码技术涉及到如下关键技术问题:1.图像的预处理过程,因为图像采集过程中经常受到噪声和光照不均的影响,这直接影响感兴趣区域的提取准确程度。2.图像感兴趣区域的确认过程,或者说研究什么是感兴趣区域,针对文章中应用的安防监控图像,将研究图像中具有人脸特征的区域作为提取的感兴趣区域,并研究其提取方法。3.对提取区域采用有别于其他区域的编码方法。图像预处理技术对于提高提取感兴趣区域的准确率和获取较清晰的图像质量至关重要。本文首先对静止图像中的噪声去除和光照补偿方法进行研究,采用改进的中值滤波和改进的Retinex算法处理所采集的图像。仿真结果表明,改进的中值滤波方法可以在保证图像细节的同时较好地去除噪声,利用改进的Retinex算法处理图像可以获得较好的图像光照效果。感兴趣区域提取是后续对图像内容进行差异性编码的基础,文中研究传统的感兴趣区域的提取方法。针对室内常见监控场景的特点,把人脸作为感兴趣区域,深入研究基于特征提取的人脸检测方法,采用基于Adaboost人眼定位和肤色特征相结合方法定位人脸,实验仿真得出利用该方法可以获得人脸定位较高的准确率。除了上述传统的基于特征提取感兴趣区域的方法外,近儿年来基于人眼视觉特征的感兴趣区域提取方法越来越受到广大学者的重视。论文在大量查阅前人研究方法的基础上,针对原有基于ITTI视觉模型提取方法中提取感兴趣区域不完整的缺陷,提出了一种改进ITTI模型和K-means算法相结合的方法来提取感兴趣区域。实验结果表明,改进方法与传统的ITTI提取感兴趣区域方法比较,获取感兴趣区域的准确率更高。在准确提取感兴趣区域之后,进一步对提取的感兴趣区域采用有别于其他区域的方法进行编码。重点研究在静止图像压缩标准JPEG2000中基于系数移位和率失真优化ROI压缩算法的流程,并比较它们的优缺点,研究其改进算法。结合这两种方法的优势,提出基于改进的率失真优化和系数移位相结合的感兴趣区域编码方法。通过实验分析,得出该方法与PSBshift算法相比提高了图像的峰值信噪比。
其他文献
摘要:随着我国高速铁路的快速发展,其运营里程已经成为世界第一。高速铁路让旅客的出行变得更加便利,可以预见在未来越来越多人将会选择高速铁路作为他们的出行方式。因此,高
视觉是人类获取信息的主要途径。视频作为视觉信息的载体,其数据量大,难于传输和存储,因此开发高效的视频编解码算法一直是学术界和工业界的关注点。从第一代视频编码标准H.2
近年来,随着无线通信业务的快速增长以及对无线通信信息传输速率和质量的要求越来越高,可用频谱资源变得日益紧张。因此如何有效充分地利用频谱资源成为无线通信技术发展的关键
某柱状药外表面需粘贴一个包覆衬套,两者之间的粘接质量直接决定了该柱状药的发射性能,而刮涂的粘接剂的厚薄是影响药柱和包覆层粘接质量的主要因素之一。因此研究一种非接触
盲信号分离(Blind Signal Separation, BSS)技术是指在源信号和传输通道参数均未知的情况下,仅利用信号间的少量先验知识,由观测到的混合信号恢复出源信号的过程。盲信号分离在无
2μm掺铥光纤激光器由于具有更宽的调谐光谱,因此在窄线宽高功率输出方面具有更大的优势,在塑料材料的激光焊接、切割等领域也有着重要的作用。由于受激布里源散射(Stimulated
随着数字媒体技术的不断发展,人们的多媒体信息也变得日益丰富。与此同时,一个显著的问题是,如何有效的管理这些多媒体资源。近年来,国内外对此已有一些初步的研究,但大都不
合格的小径管工件对于可靠发挥其作用来说具有十分重要的意义,而小径管的内腔(壁厚)尺寸是评价其合格与否的重要参数指标。测量由不同材料和加工工艺生产的小径管有许多方法,
随着信息技术的快速发展和网络的普及,信息内容和服务的智能化呈现已经成为信息技术产业发展的重要特征,智能终端产品作为新兴的信息化设备,对家庭智能生活的影响也日益凸显
近年来,物联网技术快速发展,有着广阔的应用前景,在将来会普遍应用于人们生活、工作相关的场合以及工业中的各个领域。随着物联网技术的不断发展,对传感网络的构建提出了越来