基于词性统计的中文文本零水印研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:xjtcfx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机应用的普及与计算机网络的发展,即使在图像、视频和音频数据快速增长的同时,文本数据仍然是互联网上使用最多和最广的一种信息载体,这样就给电子文本的版权保护带来了巨大的挑战。如何保护作者、作品所有者的合法权益成了社会关注的热点,而作为版权保护重要手段之一的文本水印也备受关注。目前,文本水印的研究成果大都集中在嵌入式水印,通过改变载体信息来达到嵌入水印的目的,这样势必会对载体造成一定的影响,甚至会引起攻击者的注意,从而破坏水印。而文本零水印不需要对原始载体做任何修改,它是通过提取文本中的一些特征信息来完成水印的生成,很好地解决了数字水印的不可见性和鲁棒性之间的矛盾。本文针对中文文本零水印进行研究,深入分析已有的文本水印算法,结合自然语言处理技术,主要工作如下:介绍了数字文本水印的概念、特点、分类,并对已有的文本水印算法进行了详细的阐述和深入的研究,分析各自优缺点,总结了目前文本水印研究存在的一些问题。针对文本水印存在的嵌入复杂、水印容量不够及鲁棒性不强等问题提出了两种不同的文本零水印算法。一种是基于词性频率的零水印算法,该算法结合自然语言处理技术,从汉语词性出发,通过统计不同词性的频次确定中频词性,将该词性的词语作为文本特征来构造水印;另一种是基于词性信息熵的文本零水印算法,该算法利用前种算法中已有的词性频次来计算不同词性出现的概率,用该概率获得不同词语的信息熵,进而确定文本中每个句子的信息熵,选出句子信息熵大于阈值的句子,并进行核心词的提取作为文本特征信息。实验结果表明,这两种算法不仅能够抵抗删除空格、字体变换等格式攻击,也能抵抗增加、删除以及同义词变换、句法变换等内容攻击。
其他文献
区域经济要发展,人才是关键,也是重要的推动力.本文首先分析了区域经济与人才的内涵,接着从注重人才知识能力与素质协调发展原则等方面提出了区域经济发展中人才培养的策略.
随着社会经济的不断发展和汽车保有量的增加,驾驶的安全性和操作的简单性越来越受到广泛的关注,世界各国都在积极研究开发车辆安全辅助驾驶系统。车道偏离预警系统是智能车辆
正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)技术拥有良好的抗多径性能和较高的频谱利用效率,适用于高速无线通信系统。2010年11月国际电信联盟无线通
手语通过手形和位置的组合变化来传递信息与表达语义,是听障人群的主要沟通工具。手语合成就是把自然语言翻译成手语的技术,为听障人与正常人之间的沟通搭起了桥梁。基于视频
众所周知,通过在跨数据中心的网络中运用网络功能虚拟化技术(NFV),服务提供商能够以更灵活有效的方式充分利用网络资源,并能缩短新服务的部署周期。本论文将研究如何在跨数据
实现财政局财务内部控制的全面强化,能够有效提升财务管理效率,提升财务信息真实有效性,进一步推进财政局的完善建设,确保财政局在我国经济发展当中发挥自身最大作用.为了进
铁路运输节能是铁路运输行业的发展趋势,也是未来铁路运输企业发展的基本要求.本文通过对铁路运输过程中的各个环节进行叙述,从节能技术创新方面着手,对铁路运输节能发展对策
本文主要阐述了大数据时代的特点,同时提出了大数据时代数字出版产业的发展趋势,包括利用大数据技术来实现精准营销、利用大数据技术来完成个性化选题策划、利用大数据技术来
近年来,利用信号的统计特性提升波达方向(DOA)估计算法的性能已经成为阵列信号处理的一个重要研究领域。其中,非圆信号因在阵列孔径拓展和估计精度提升等方面的优异性能,更是
无线体域网是以人体为中心,由若干低功耗、微型、智能的节点和一个协调器组成的人体范围内的无线通信系统,它在多个领域都有重要应用,比如,医疗监控、运动检测等。无线体域网