论文部分内容阅读
随着云计算的普及,越来越多的数据信息逐渐向云端转移。将数据存储到云计算服务器中将大大减轻用户或企业本身的存储管理负担,同时使用户能够十分便捷的访问云计算服务器中的数据。在云存储的模式中,数据是需要完全交给云计算服务提供者进行存储和管理的,但是云计算服务提供者本身并不是完全可以信赖的,所以出于安全性的考虑,云存储需要得到更广泛的应用,云端数据的安全性成为了当前亟需解决的一项难题。数据加密是保证云端数据安全性的有效手段。但加密后的数据检索又与普通明文检索有很大的不同,传统的明文检索方法在密文检索中不再适用。在以前的模糊搜索策略中,虽然在关键字字典的基础上构建模糊关键字集合能实现模糊搜索,但当关键字集合不断增大的时候模糊关键字集合会成倍数增长,这样检索效率将很难让人满意。在已有的加密数据模糊搜索方案的基础上,舍弃了原来的模糊关键字集合,采用在本地构建关键字字典的方法,使搜索请求中的关键字与关键字字典中的关键字进行直接匹配校正来实现模糊搜索,提高了检索效率。同时,目前中英文数据混杂的情况越来越多,而已有的模糊检索方案仅支持单一语种检索,采用中英文对照表转换中文关键字的方式支持中英文关键字检索,使得查全率得到了提高,大大提高了用户的搜索体验,同时保护了用户的隐私。本文具体研究工作如下。(1)在研究了当前已有的加密搜索模式的基础上,提出了自己的模糊搜索模式,即舍弃原来需要的模糊关键字集合,在数据拥有者将关键词抽取出来后,先将全部中文关键词分别转换为英文关键词和拼音,并构成关键字字典,再将其关键字字典存储在本地。搜索过程中先做关键字语言转换和中文拼音转换,然后再与本地关键字字典中的关键字做编辑距离替换,从而顺利构建中英文的模糊搜索模式。(2)在前面提出的搜索模式上,根据中英文的对应关系,多个中文词对应同一个英文词的特点,进一步提出了中文同义词搜索模式。对于同义的中文词汇,总能准确的搜索到目标文档数据,实现了对英文数据的模糊高效检索,且同时支持中文的同义词检索。(3)最后测试本文所提出的搜索模式的可行性,安全性和高效性。选取了2000篇的中英文文献数据作为测试数据,最后的结果达到预期要求,效率有所提高,查全率提高显著。