自然语言文本中数字水印的设计与研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：ohmygod100

【摘要】

：

自然语言是人类相互交流中最主要、最准确、最高效的方式。随着数字时代的来临,人们每天都会接触大量的电子文档、网络新闻、论坛、博客等,自然语言数字文本已经成为新的交流

【作者】

：

余振山

【出处】

：

中国科学技术大学

【发表日期】

：

2009年期

【关键词】

：

数字水印自然语言文本信息隐藏隐写术隐写分析版权保护水印检测水印还原水印模型宋词

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自然语言是人类相互交流中最主要、最准确、最高效的方式。随着数字时代的来临,人们每天都会接触大量的电子文档、网络新闻、论坛、博客等,自然语言数字文本已经成为新的交流层面上最重要的载体,如何保护其版权是亟待解决的问题。数字水印是数字文件版权保护的重要手段。对于数字水印的研究首先在多媒体载体的领域展开,在图像、音视频方面都出现了针对人类视觉特点或者听觉特点的水印算法。由于这几种媒体的处理手法相近,冗余度也较高,研究不断深入。近年来逆向的对水印算法的检测等攻击分析也逐渐得到重视。数字水印是数字文件版权保护的重要手段。对于数字水印的研究首先在多媒体载体的领域展开,在图像、音视频方面都出现了针对人类视觉特点或者听觉特点的水印算法,由于这几种媒体的处理手法相近,冗余度也较高,研究不断深入。逆向的对水印算法的检测等攻击分析也逐渐得到重视。反观文本方面,存在处理手段特殊、冗余度低、自然语言规则复杂、计算语言学受限等困难,文本数字水印的研究起步晚,成果也较少。但是因为文本既常见又重要,所以近年来投身文本水印领域的研究者逐渐增加,从排版类到语法语义类都出现了新颖的水印算法,同时文本水印算法的检测分析工作也已起步。不过总体来说,文本数字水印领域还未出现足够实用的方案,水印算法的检测分析成果凤毛麟角,整体上缺乏系统的理论基础。有鉴于此,本文的研究工作及取得的相应成果主要包括:1.自然语言文本中数字水印模型的研究。建立了适合文本的通讯模型,根据密码学基础的方法定义了水印的不可检测性、程序敌手、人类敌手、不可见攻击、鲁棒性等概念,构造了用交互证明系统验证水印算法安全性的方法,并将其应用于对实际水印系统的评价。2.自然语言文本中数字水印的设计。提出并实现一种新的文本数字水印算法——宋词水印。这是一种附加型生成文本水印,算法由水印信息直接生成一段宋词,这段宋词在字数、行数、句子形式、格律和韵脚等方面符合某个词牌,具有很强的迷惑性。将生成的宋词附加于载体文本中,验证时提取这段宋词,对照词典即可还原出水印信息。由于生成的宋词具有较高的迷惑性,所以水印具有良好的隐蔽性。实验结果表明水印信息与生成文本的大小比值达到16%,因此本方法也可作为一种高嵌入率的文本隐写算法。据我们所知,这是第一个利用特殊体裁的文本水印算法。3.自然语言文本中数字水印的检测研究。针对排版类的Snow水印设计检测算法,并指出检测一般性排版类水印算法的思路。针对语义类的基于同义词替换的水印,设计利用上下文信息的检测算法,通过考量关键词是否是同义词集合中最适合上下文的词语,判断该点是否被嵌入信息,整篇文章的关键词的考量结果导致文本是否带有水印信息的判断。同一同义词集合的词语对同样的上下文比较合适度时,我们用IDF系数调整常用词和冷僻词之间的差距。实验表明检测算法对于T-Lex同义词水印系统达到了90.0%的准确率、86.6%的精度和82.5%的召回率。针对基于翻译的水印系统,我们也设计了检测的方法。4.提出将整个互联网作为语料库的思想。如果将每个包含自然语言文本的网页视作语料库中的一篇文档,那么整个互联网就可视为一个超大规模的、按影响力有序的、实时更新的语料库。配合搜索引擎等工具,人们可以从中提取自然语言使用习惯等传统语料库因规模受限、成本过高等原因无法有效提供的信息。

其他文献

警察权益的法律保护

警察权益受侵害的现象时有发生,这既有警察职业特点所造成的外伤、也有警察权力与公民权利冲突所造成的误伤、也有监督机制不规范所造成的内伤、更有个别警察整体素质偏低所

期刊

警察权益法律保护司法保护法律援助

壳寡糖—细菌纤维素的制备及体外生物相容性评价

纳米纤维素是一种由细菌合成的新型高分子功能材料,因其具有三维纳米网状结构,良好的生物相容性、机械稳定性和可塑性等性能,已被广泛用于食品、纺织纤维、高强度纸、人工皮

学位

细菌纤维素壳寡糖创伤敷料木醋杆菌

新兴产业研究方法论论纲

国内新兴产业研究刚刚兴起,缺少系统、科学的方法论体系,缺乏综合、有效的分析方法和工具。本文主要从研究内容、理论基础、研究方法与分析工具等方面对新兴产业研究的方法论

期刊

新兴产业新兴技术方法论创新

心理社会治疗模式下社交焦虑障碍青少年的社会工作介入

社交焦虑障碍是一种常见的严重影响到青少年身心健康的慢性疾病,社交焦虑障碍多产生于青少年时期,对青少年的学习生活带来极大的困扰。随着经济的快速发展,青春期出现社交焦

学位

社交焦虑障碍心理社会治疗青少年

参芪化瘀方结合常规西药对宫缩乏力型产后出血的疗效及对FIB、D-D的影响

目的:观察参芪化瘀方结合常规西药治疗宫缩乏力型产后出血的临床治疗效果及其对FIB、D-D的影响。方法:选取宫缩乏力型产后出血产妇93例,随机分为对照组及观察组,对照组45例,

期刊

参芪化瘀方FIBD-D宫缩乏力

王阳明“致良知”思想研究

王阳明(1472-1529)是明代著名的哲学家,“致良知”是其心学体系的核心思想。王阳明的致良知思想是在他不断的理论探索和事功磨练中逐渐形成的。正是在不断的理论思考和事功磨

学位

王阳明良知致良知本体工夫

铝镁钙铁合金中铝测定方法的实验研究

采用稀盐酸溶样,硝酸氧化,强碱分离,EDTA络合,以氟化物取代,铅标准溶液返滴定的方法,在缓冲溶液的pH值为5.5时,测定了铝镁钙铁合金中的铝。该方法操作简单,回收率99.4%～100.4%

期刊

铝镁钙铁合金铝硝酸铅滴定

“公安人口”概念的实践与理论探讨

“公安人口”指具有社会危险性或者具有违法犯罪的可能,由公安机关实施特定管理的人员。这一概念既涵盖当前公安机关分类过细的人口管理工作,又扩大了部分管理对象,满足了公

期刊

人口管理公安人口

企业新闻采编人员素质和团队建设

无论何种形式的新闻都必须具有亲民性,才能赢得百姓的信任,提高新闻的关注度,这就对新闻采编人员的专业水平和综合素质提出了较高的要求。但是,从企业新闻采编人员结构可以看

期刊

企业新闻采编人员素质团队建设

黑龙江省农业保险现状分析与对策研究

农业作为基础产业，由于自身的弱质性和生产过程的特殊性，在整个再生产循环过程中面临着许多风险，是典型的风险产业。黑龙江省是中国最大的商品粮生产基地，粮食商品率达到70％，享有“

期刊

农业保险农业保险制度体系黑龙江省

自然语言文本中数字水印的设计与研究

其他学术论文