面向云端加密数据的多关键字模糊检索策略

来源 :东华大学 | 被引量 : 1次 | 上传用户:longyouxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算的普及,越来越多的数据信息逐渐向云端转移。将数据存储到云计算服务器中将大大减轻用户或企业本身的存储管理负担,同时使用户能够十分便捷的访问云计算服务器中的数据。在云存储的模式中,数据是需要完全交给云计算服务提供者进行存储和管理的,但是云计算服务提供者本身并不是完全可以信赖的,所以出于安全性的考虑,云存储需要得到更广泛的应用,云端数据的安全性成为了当前亟需解决的一项难题。数据加密是保证云端数据安全性的有效手段。但加密后的数据检索又与普通明文检索有很大的不同,传统的明文检索方法在密文检索中不再适用。在以前的模糊搜索策略中,虽然在关键字字典的基础上构建模糊关键字集合能实现模糊搜索,但当关键字集合不断增大的时候模糊关键字集合会成倍数增长,这样检索效率将很难让人满意。在已有的加密数据模糊搜索方案的基础上,舍弃了原来的模糊关键字集合,采用在本地构建关键字字典的方法,使搜索请求中的关键字与关键字字典中的关键字进行直接匹配校正来实现模糊搜索,提高了检索效率。同时,目前中英文数据混杂的情况越来越多,而已有的模糊检索方案仅支持单一语种检索,采用中英文对照表转换中文关键字的方式支持中英文关键字检索,使得查全率得到了提高,大大提高了用户的搜索体验,同时保护了用户的隐私。本文具体研究工作如下。(1)在研究了当前已有的加密搜索模式的基础上,提出了自己的模糊搜索模式,即舍弃原来需要的模糊关键字集合,在数据拥有者将关键词抽取出来后,先将全部中文关键词分别转换为英文关键词和拼音,并构成关键字字典,再将其关键字字典存储在本地。搜索过程中先做关键字语言转换和中文拼音转换,然后再与本地关键字字典中的关键字做编辑距离替换,从而顺利构建中英文的模糊搜索模式。(2)在前面提出的搜索模式上,根据中英文的对应关系,多个中文词对应同一个英文词的特点,进一步提出了中文同义词搜索模式。对于同义的中文词汇,总能准确的搜索到目标文档数据,实现了对英文数据的模糊高效检索,且同时支持中文的同义词检索。(3)最后测试本文所提出的搜索模式的可行性,安全性和高效性。选取了2000篇的中英文文献数据作为测试数据,最后的结果达到预期要求,效率有所提高,查全率提高显著。
其他文献
空间离群检测能够帮助人们发现潜在的、有趣的空间数据模式,并把它用于未来演变趋势的分析研究。在许多实际情况下,这些不寻常的空间离群事件往往具有出乎意料的研究价值,因此空
随着计算机科学的高速发展,系统攻击与入侵行为正对国家安全、社会生活造成越来越大的威胁与隐患。为对系统进行安全防御,有效地解决入侵检测,结合数据挖掘的系统日志分析由
在军事或者医疗等需要精密无误图像信息的领域往往需要在图像中加入认证信息,如果用传统的数字水印方法,会永久地破坏掉一部分图像信息。然而在这些领域,往往一点点的差错都会导
物流公共信息服务系统是现代物流信息系统的重要组成部分,主要负责物流信息的采集、传输、存储、处理、发布,以及企业物流信息资源的整合。  本课题围绕物流公共信息服务系统
伴随网络规模扩大及新技术应用,IPv6协议得到了广泛发展。现阶段网络正处于IPv4与IPv6共存时期,新的网络环境要求网管技术在传统IPv4网管的基础上解决过渡技术、IPv6网络的管理
随着时代的发展,GUI (Graphical User Interface,图形用户接口)已经发展成为了软件领域必不可少的技术,大部分的软件都使用了GUI,这也使得基于GUI软件的测——GUI测试变的必
近年来,微博作为一种新的信息发布平台和社交平台越来越受到人们的关注,蕴含着巨大的政治和商业价值。通过对博文大数据展开情感倾向性分析,可以实现微博营销、品牌宣传、客户关
视频点播服务(Video-on-Demand)允许用户进行交互式操作,即用户可以跳跃式观看某个影片的不同时间段,已成为互联网上最流行的应用之一。在P2PVoD中,观看同一部影片的不同用户
SYN洪泛攻击是目前网络中危害最大的拒绝服务攻击,由于很难区分攻击请求与正常请求,SYN洪泛攻击很难防御,目前提出的各种防御措施均不能保证网络设备在SYN洪泛攻击中存活。流量
超声检查报告记录了病人在一次超声检查后得到的影像描述及医生的诊断结果,是重要的临床信息,也是医学领域研究重要的数据来源。为了能够更准确地描述患者的病情,医生通常以