基于词向量的自然语言隐写分析方法研究

来源 :长沙理工大学 | 被引量 : 2次 | 上传用户:lsj9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息隐藏技术是信息安全领域中的一个热门研究方向,可广泛地用于机密信息的安全存储与传输、隐蔽通信、数字媒体的版权保护等。但信息隐藏技术也可能被恶意滥用,如秘密窃取机密文件、秘密计划和执行犯罪活动等,对社会、国家、个人造成难以预估的损失,因此必须研究隐写分析技术来检测利用信息隐藏技术非法传递的秘密信息,以保证和维护信息安全和通信安全。本文针对目前自然语言隐写分析方法存在的语义信息分析不足、检测精度较低的问题,利用词向量包含丰富的深层语义信息的特点,对正常文本和隐写文本进行分析来实现隐写文本的识别。主要研究工作如下:(1)提出了一种基于词向量度量合适度的自然语言隐写分析方法以改进隐写分析技术。该方法使用skip-gram模型对大规模语料库进行训练获得每个词的词向量。然后,将文本中出现的每个同义词及其上下文的单词都表示为实数向量空间中的一个词向量,并利用词向量计算词与词之间的相关性;并计算每个上下文单词的TF-IDF值来加权同义词与上下文单词的相关度,从而计算出同义词在特定上下文中的合适度;最后,根据信息嵌入过程中同义词替换操作对同义词合适度的影响提取检测特征形成特征向量,并采用SVM模型训练分类器来识别基于同义词替换的隐写文本。实验结果表明,所提出的隐写分析方法比已有的两种同类隐写分析方法具有更高的检测能力,平均检测准确度提高了至少3.51%。当使用与隐写文本题材一致的特定语料库训练语言模型获得的词向量,该方法的检测性能进一步得到了提高。(2)提出了一种基于词向量和卷积神经网络的自然语言隐写分析方法。该方法利用连续神经网络语言模型Skip-gram训练特定语料库获得每个词的词向量后,将待分析文本中所有同义词和其上下文窗口中单词转换成向量矩阵作为卷积神经网络的输入。然后,采用了三种具有不同窗口大小的卷积核并行对输入进行卷积操作,自动学习到自然语言隐写分析特征;接着,使用maxpool对卷积层的输出特征进行池化以解决文本序列长度变化的问题;最后,利用全连接层实现对隐写文本和正常文本的分类。实验结果表明,提出的方法大大提高了现有自然语言隐写分析方法的检测性能,平均检测准确度达到了98.18%。
其他文献
本文采用密度泛函方法对不同立体手性的邻碘酰苯胺(N-(2-IOodo-4,6-dnmethylpeenyl)-N,2-(1iimethyL-(2E)-buaenaiide)在AIBN/HSnBu3催化下的脱碘反应、阻旋异构化反应和分子内自由
党的十八大以来,以习近平同志为核心的党中央肩负着全面建成小康社会、建成富强民主文明和谐美丽的社会主义现代化强国、实现中华民族伟大复兴的历史重任。“创新是引领发展
随着中国企业海外并购数量及金额的大幅提升,私募股权基金愈发积极地参与其中。跨境并购,尤其是行业巨头的合并往往能产生显著的协同效应,却常常面临着诸多制约。而与此同时,
索支承体系桥梁是现阶段大跨度桥梁中的主要结构形式,而拉索则是索支承体系桥梁中至关重要的受力和传力构件。因此,准确地识别拉索索力等参数在桥梁的施工控制和安全运营中具有重要意义。本文基于索力测试中最常用的频率法理论,分析了拉索索力、抗弯刚度等参数和自振频率之间的复杂规律,提出了使用 LNN(Legendre Neural Network,勒让德神经网络)和 XGBoost(eXtreme Gradie
在服役环境中腐蚀因素的不断侵袭与运营荷载不断增长的双重压力下,钢筋混凝土桥梁的耐久性问题成为工程领域广泛关注的问题之一。对钢筋混凝土桥梁进行耐久性评定与可靠性分析,不仅能够揭示结构服役过程中面临的潜在风险,便于科学合理的安排维修养护资源,而且研究成果可以用于指导结构设计。服役环境中多种腐蚀因素(如冻融、碳化、氯离子侵蚀等)的作用使得结构材料性能发生劣化,最终导致抗力衰退,耐久性寿命降低,给桥梁的安
函数空间上的算子理论是函数论的重要研究领域之一,本文利用分析和构造检验函数的方法,研究了从Zygmund型空间到Bloch-Orlicz空间上的Stevic-Sharma算子和Volterra型算子的有
随着当今计算机技术的飞速发展,数据的爆炸性增长使得从中发现有价值的信息变得越来越困难,原本在低维数据集上能够取得良好聚类效果的方法,由于受到“维灾”影响,无法在高维
随着现代科学技术的发展,手机、数码相机、笔记本电脑等便携式电子设备在人们的日常生活中扮演着不可替代的角色,电子设备的运行离不开储能电池的支撑,锂离子电池具有高能量密度、工作范围宽、无记忆效应且无气体排放等优点,被广泛用作便携式电子设备的储能电池来提供能量,全球可充电锂电池的的市场总值高达100亿美元,并且呈逐年增长的趋势。然而,到目前为止,锂离子电池一直受限于资源短缺,生产成本高以及无法满足对容量
在重离子碰撞初期产生大量高能的部分子,之后这些部分子在穿越QGP介质的过程中由于与介质的相互作用,诱发辐射胶子造成能量损失,导致喷注的横动量展宽等现象,这个过程称为喷注淬火效应。喷注淬火效应可以作为探测QGP信号的一个强有力探针。此外,在碰撞实验中观察到了强磁场的产生,而且还发现QGP还具有化学势。因此,在磁场、化学势背景下QGP性质的研究具有较重要的意义,除了一些对理论上的发展,在QCD的动力学
随着我国筑坝技术的飞速发展,高坝大库数量急剧增多,高度越来越高,甚至超出现有设计规范,拱坝以其厚度薄、整体性好等特点备受青睐,特高拱坝的安全问题是当前坝工界关注的焦点;同时,施工期和蓄水初期又是大坝失事或事故出现的多发期,施工期结构工作性态直接影响运行期结构性态,最终影响工程结构的安全。因此,有效监控施工期特高拱坝的应力状态,保证特高拱坝安全施工意义重大。本文在国家自然基金“混凝土坝长期变形特性数