基于神经网络的音频隐写分析方法研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:xiaoxi21175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频隐写主要利用音频的冗余空间嵌入秘密消息,具有较强的隐蔽性。与之对应的音频隐写分析则是分析可疑音频,判断其是否携带秘密消息,甚至提取秘密消息。传统音频隐写分析方法基于人工特征提取,普遍存在检测准确率低、通用性较差的问题。现有基于神经网络的音频隐写分析方案检测准确率仍有待提高,且未考虑不同时长音频的隐写检测,同时大部分模型的参数规模较大,对运行环境有较高的要求。针对上述问题,本文主要研究工作如下:1.提出了一种融合多尺度卷积和残差网络的音频隐写分析模型。基于WAV音频隐写算法的特性,本文提出的模型使用高通滤波器对原始音频数据进行预处理,抑制音频内容对隐写特征提取的负面影响,锐化隐写嵌入噪声。该模型引入了多尺度卷积和残差网络的特性,提取不同尺度的深层次隐写特征并加以融合。与其它隐写分析模型不同,该模型未使用全连接层,而是使用1×1卷积层把特征图的维度调整到类别数,运用全局平均池化聚合特征,送入Softmax分类器获得分类概率,解决了不同时长音频的隐写检测问题。实验结果表明,针对不同嵌入率的WAV音频隐写算法,该模型的检测准确率都要优于现有的隐写分析方案。其中,对于嵌入率为0.1的最低有效位匹配隐写算法,该模型检测准确率达到69.87%,相比其它隐写分析方法提高了10%以上。该模型直接用于检测与训练集不同时长的音频时,检测准确率优于现有隐写分析方案。2.提出了一种基于Res Ne Xt的轻量级AAC音频隐写分析模型。基于对AAC隐写算法特性的分析,本文提出的模型选择AAC音频的QMDCT系数矩阵作为输入数据。为了增强载体音频和载密音频之间的隐写差异,通过实验选择了适合AAC隐写分析任务的高通滤波器对输入数据进行预处理。参考Res Ne Xt模型组建了残差学习模块,提取数据中的深层次隐写特征信息。最后根据提取到的特征进行分类,得到隐写分析结果。实验结果显示,该模型可以用于检测不同嵌入率的AAC隐写算法。即使在嵌入率为0.1的情况下,模型对基于Huffman码字映射的隐写算法的检测准确率为85.5%,明显优于其它隐写分析方案。同时,该模型的参数更少,占用空间更少,更加轻量高效。综上,本文聚焦音频隐写分析的研究,提出了两种基于神经网络的音频隐写分析方案,提高了音频隐写分析的检测准确率,同时应用场景更加广泛。
其他文献
机械臂系统具有代替人完成各种复杂的、精密的、危险的工作,提高劳动生产力等优点,被广泛地应用于各种工业场所。机械臂系统中存在的不确定性和外部干扰会对机械臂的位置跟踪精度产生影响,而如何克服系统中的不确定性和外部干扰,对于提高机械臂的位置跟踪精度具有重要的研究价值和意义。本文针对含有不确定性和外部干扰的机械臂系统,基于参数辨识、滑模控制、神经网络控制、不确定性和干扰估计器、自抗扰控制等方法设计了解决不
学位
随着计算机视觉技术的日益发展,相关成果已经广泛应用于如医疗、交通、国防等多个领域,但在雾霾等恶劣天气的影响下,成像设备获取到的图像质量不佳,进而影响相关技术应用的性能。因此,图像去雾成为了一个至关重要的问题,也是现在研究的热门领域之一。由于当前去雾数据集均为合成有雾图像,与真实有雾图像的差异较大,一定程度上限制了深度学习去雾算法的性能。为解决真实有雾图像无法应用到网络训练的问题,本文基于半监督学习
学位
多相图像分割的变分模型是典型的多变量优化问题,其非线性、非凸性、非光滑特性导致局部极值问题突出,模型解依赖于初始条件和惩罚参数,实际应用困难。通过箱函数、广义余面积公式、千层饼公式等可从理论上将原问题转化为全局凸优化问题,但随着分割相数的增加,箱函数的维数急剧增加,导致了计算复杂、效率低下。针对于以上问题,本文对基于一个标量多标签函数划分多个区域的多相图像分割变分模型-LLT模型改进,主要创新点如
学位
COVID-19问题并没有随着时间和季节的更替而消失,尽管大多数国家在抗击疫情和疫情防控等方面取得了显著成效,但公众对新型冠状病毒的认识还远远不够。在COVID-19大流行期间,基于位置的游戏(LBGs)行业受到了冲击。虽然围绕提供科学信息以预防COVID-19和改善个人护理相关严肃游戏的研究得到了很好的发展,但是没有研究表明LBG可用于帮助预防COVID-19感染。因此,本研究针对COVID-1
学位
随着中国社会主义现代化建设和工业化的发展,社会对煤炭的需求也大幅度增加,目前我国工业使用的锅炉主要形式是循环流化床锅炉,燃煤锅炉是重要的热能动力设备,在工业领域广泛应用。但是工厂中的燃煤锅炉在使用过程中会产生大量污染物,包括二氧化硫、二氧化碳、氮氧化物以及烟尘等,这不仅会对生态环境造成污染,也威胁着人民群众的身体健康,不符合我国倡导的可持续发展理念,提高燃煤锅炉的燃烧效率和降低氮氧化物排放量成为首
学位
文本检测是一种利用相关算法提取图像中文本区域的技术,用以实现对自然场景下或电子版文档中文字的检测,其在场景解析,即时翻译等领域有着广泛应用,并在计算机视觉研究中扮演重要角色。文本检测分为基于机器学习的方法和基于深度学习的方法,与基于机器学习的方法相比,基于深度学习的方法能够不断的优化检测网络,在检测速度、精度和适应各种不同应用场景的能力方面有很大提升。但是,受到传统CNN网络、特征融合和文本形状复
学位
人体姿态估计任务旨在从图像或视频中定位出人体关键点位置,该任务可作为其他计算机视觉任务的基础。近年来,人体姿态估计受到了越来越多的关注,并被广泛应用到人机交互、计算机仿真系统等现实场景。现有的基于深度学习的算法克服了手工提取特征主观性较强的弊端,具有强大的特征学习能力。然而如遮挡、训练数据不足等问题仍制约着算法检测精度的提升,且复杂的网络结构会导致检测速度过慢。针对上述问题,本文提出了以下三种解决
学位
计算机视觉和自然语言处理是人工智能领域中热门的研究方向,目的是让计算机模拟人类的视、听系统。显著性检测是计算机视觉的重要研究内容,尤其是视频显著性检测得到了更多的关注,其旨在通过模拟人类的视觉系统自动识别出场景中最吸引人类注意力的物体或区域,可以从海量的数据中获取重要信息,将有限的计算资源分配给更重要的信息。但人类是同时感知声音和视觉模态,故音视结合的显著性检测更符合真实的场景。由于音频信息和视频
学位
权重初始化是指在卷积神经网络开始训练之前,给予其合适的初始值,优化模型在训练过程中的收敛速度以及最终的泛化能力。卷积神经网络的训练目标是寻找权重最优解,因此,合适的权重初始化方法是卷积神经网络快速收敛并获得良好泛化性能的基础。现有的随机初始化方法加重了模型训练的负担,迁移学习初始化方法对迁移前后的目标任务以及模型结构具有一定的要求,从而限制了其应用范围。因此,本文从预训练模型的权重统计分析入手,通
学位
内蒙古东七一山钨多金属矿位于北山造山带东段,是一个以钨为主,共伴生锡、钼、铷、铍、铌、钽、铁和萤石的综合型矿床。本次工作对含矿花岗质杂岩开展了岩石学、地球化学、锆石U-Pb及辉钼矿Re-Os年代学研究。富W-Sn-Mo花岗岩岩性为细粒似斑状二长花岗岩、中细粒似斑状二长花岗岩、花岗斑岩,结晶年龄分别为220.6±1.6Ma、220.4±1.3Ma和220.0±1.1Ma。富Rb-Be-Nb-Ta花岗
期刊