多媒体语义提取方法及其在视频水印中的应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:nanometer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和网络技术的飞速发展,视频和图像等多媒体数据呈几何级数增长,同时人们对这些视觉媒体内容的需求也越来越多,越来越广泛,因此如何从浩如烟海的数据资源中实现信息检索逐渐成为目前的研究热点。但是现有的检索技术多是基于底层视觉特征的检索,与人们所能理解的高层语义概念相去甚远,这严重地影响检索的实际效果。多媒体数据所包含的语义内容无法用底层视觉特征来准确表述,即在底层视觉特征和包含的语义之间存在着“语义鸿沟(Semantic Gap)”,如何跨越“语义鸿沟”,有效的提取语义信息,已经成为多媒体研究领域中一个亟待解决的问题。首先,论文阐述了基于内容的信息检索技术(Content Based Information Retrieval,CBIR)的研究和发展现状,介绍了语义提取研究的相关理论及当前常用的语义提取方法,包括基于机器学习的语义提取方法、基于反馈学习的语义提取方法和结合特定领域的语义提取方法等。论文研究并实现了两种典型的基于机器学习的图像语义提取方法,包括基于支持向量机(Support Vector Machine,SVM)的语义提取和基于一致语言模型(Coherent Language Model,CLM)的语义提取。实验结果表明,这两种方法对图像有较好的语义提取效果。其次,论文提出了一种基于模糊关联分类的视频语义提取方法,该方法引入模糊概念,解决了关联规则挖掘“边界过硬”问题;把关联分类规则挖掘看作约束优化问题,通过构造自适应惩罚亲和度函数,以提高评估抗体优劣程度的准确性;采用混合双变异算子,以获得更好的全局和局部搜索能力;采用老化算子,在保证种群多样性的同时减小了计算复杂度。论文将该方法用于视频运动语义和纹理语义提取,取得了令人满意的实验结果。最后,论文将高层语义应用到视频数字水印中,提出了一种基于视频语义的AVS(Audio Video coding standard)压缩域鲁棒水印方法,该方法利用获得的视频运动语义,在线生成动态语义水印;根据运动语义自适应确定感兴趣镜头,根据纹理语义自适应确定感兴趣I帧,根据人眼视觉掩蔽特性,选择运动剧烈和运动缓慢区域作为感兴趣区域,将水印嵌入在感兴趣I帧的亮度子块预测残差DCT中频系数上;利用视频纹理特征,自适应控制水印嵌入强度。实验和分析表明,该方法不仅对各种常规攻击鲁棒,而且对帧重组、帧内裁剪和帧删除等视频特有攻击表现出强的鲁棒性。论文最后对本文工作进行了总结,并提出了下一步研究探索的方向。
其他文献
随着计算机、多媒体技术和互联网应用的普及和发展,数字多媒体信息的版权保护和电子商务活动的身份认证等网络信息安全需求日益强烈,要求也愈发严格。本文在系统地总结分析前
学位
虚拟化是支持新型互联网体系的有效手段,ForCES的控制平面与转发平面分离思想为路由器的虚拟化提供了实现基础。本文主要研究在ForCES架构中如何实现虚拟服务,其内容包括:根据
无线Ad hoc网络是一种具有很强抗毁性和自愈能力的无线移动网络,它可以在没有预先架设网络基础设施的情况下,由节点自组织形成网络。无线Ad hoc网络的移动、无线和多跳等特性
物联网(The Internet of Things,IoT)顾名思义,物联网就是“物物相连的互联网”。RFID被誉为21世纪最有应用及市场前景十大技术之一,它是物联网的核心及关键。它是一种通过电磁场
在无线Ad Hoc网络中,无线信道由多节点共享,协调节点访问信道的媒体接入控制(MAC)机制是无线Ad Hoc网络的关键技术之一,也是无线Ad Hoc网络支持服务质量(QoS)的关键。本文在I
近年来,随着物联网的迅速发展,无线传感器网络(WSNs)作为信息科学领域的一个新的发展方向得到国内外各界的关注。尤其是以Zigbee技术为支撑的WSNs由于其低成本、高效率、高可
MIMO雷达是最近年来出现的一项新的雷达技术,也是下一代雷达发展的主要方向之一。由于空间分集、波形分集等技术的应用,与传统的相控阵雷达相比,MIMO雷达能够获得更优的目标
网络业务持续增加对衔接各网系的网关设备提出了更高的要求,而网络处理器不仅具有ASIC的高性能,还具有可编程的灵活性,因此以网络处理器为硬件平台的网关设备可以很好的满足