论文部分内容阅读
随着相关领域技术与产业的发展,我们迎来了大数据时代。大数据技术的战略意义在于,通过专业化处理可以从海量数据中发掘出潜在的价值,从而为分析、预测及决策提供可靠的依据。因此,大数据相关产业的发展受到各国政府的极大重视。然而数据采集、清洗、存储和分析依赖于昂贵的专业设施,对个人与中小企业来说难以负担设备购买与维护的开销。云计算作为新兴的服务计算模式,为用户提供便捷的数据存储、数据处理、信息共享和虚拟化服务,目前已成为大数据工程的理想解决方案。用户可以将自己的数据外包给云服务提供商,随后根据自己的需求来获取相应的数据,或者获取基于数据的服务,这一模式一般成为外包计算。然而制约外包数据服务推广的一个重要因素在于对数据安全和隐私的担忧,特别是金融、医疗等敏感领域,如果数据遭到云服务提供商的滥用或泄漏,将会给用户造成重大的损失。密码学是保证数据隐私的基础工具,然而传统的加密方案虽可以确保数据的隐私性,但是加密会限制数据的可用性,使得云失去了对数据处理、分析和挖掘的能力。因此在云环境下需要设计新的密码学原语,使之既能保证数据隐私性,又能允许云服务提供商能够对数据做特定的操作。可搜索加密是云计算环境中确保存储安全与数据隐私的重要密码学原语,当用户将文档加密上传云端后,它可以按照用户的查找条件进行搜索并获取所需要的密文文档,同时保证云服务器仅能获得极少的信息。早期可搜索加密方案的研究集中在安全性、搜索效率和更广泛的搜索表意等方面,近年来的研究开始关注数据集可动态更新的对称可搜索加密方案。本文提出了一个新的动态对称可搜索加密方案,在运行效率方面,该方案搜索算法的时间复杂度为O(1),而文档增加和删除操作的时间复杂度为O(m"n)和0(N)(其中m"表示新增文档的关键词个数,N表示文档-关键字配对数,n表示字典大小),整体效率优于现有方案;在安全性方面,该方案可以抵抗选择关键词攻击,且与之前方案相比本文方案做到了更少的信息泄漏。目前可搜索加密的一个显著缺陷在于,通常方案都是以单词为单位作为查询条件,这对于黏着语语料库并不适用,其原因在于这类语言是由语素组成长字符串来表示语义。因此搜索此类语言需要以字符为单位进行处理。我们选取最长公共子序列作为评定字符串相似度的依据,利用部分同态加密为基本密码学原语,构造了在密文下求解最长公共字串的方案。该方案具有显著的高效性和可拓展性,实现该方案仅需对数级深度的同态电路,需要的乘同态运算次数为O(μ-1)log(μ-1))(μ为编码单字节所需比特数)。作为隐私防护的外包计算中的基本组件,该方案在诸多具体问题中都有重要应用。