具有隐私保护的外包数据去重与计算研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:haolei88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算和物联网的快速发展,全球的数据规模呈现爆炸式增长,大数据时代随之到来。由于云具有强大的存储和计算能力,越来越多的数据拥有者开始把他们的数据存储和管理外包给云服务提供商。但是由于云平台的不完全可信性和用户的隐私保护需求,因此数据拥有者在将数据外包给云之前通常会先对其进行加密。然而,利用传统的数据加密技术又会引发诸多问题。例如,资源受限的物联网用户可能希望具有某些属性的用户或组织能够访问他们的数据并加以聚合统计分析,云端也可能存储着大量用户的重复数据,而加密会阻碍对数据的计算以及对重复数据的删除。另外,依托大数据的深度学习开始在语音和文本识别以及疾病诊断等方面展现出优势,许多组织都希望在他们的组合数据集上协作地训练深度学习模型以提高学习准确度。但出于数据保密性和法律法规等要求,他们通常无法共享明文数据集,如何实现隐私保护的协同深度学习也是一个亟待解决的问题。不过,无论是数据外包还是协同学习,要解决的首要问题都是互联网中各实体之间的安全高效的相互认证。本文针对以上应用场景和安全问题展开了研究工作,并取得了以下成果:(1)在移动无线网中实现了具有位置隐私保护的轻量级切换认证。在数据外包和深度学习等场景中,都包含了不止一个实体,存在着用户与云端的通信和用户之间的通信,那么要解决的首要问题就是各实体之间的相互认证。随着移动智能设备的普及,一种典型的认证场景就是移动无线网中的切换认证。现有的切换认证方案要么需要移动节点首先与当前接入点进行认证以获得他和目标接入点进行认证所需的某些关键信息,要么需要移动节点端承担昂贵的计算量。本文利用基于身份的签密技术设计了一个安全高效的切换认证方案。签密技术与传统的先签名后加密方法不同,它允许发送方在一次操作中同时对数据进行签名和加密,从而大大降低了计算成本。在本文方案的整个切换认证过程中,移动节点在不泄露自己的位置信息和真实身份信息的情况下就可以直接与目标接入点进行相互认证。资源受限的移动节点只需要计算四次点乘,而且安全分析表明本文的方案实现了对移动用户的位置隐私保护和完善的前向/后向安全性。(2)在数据外包的客户端实现了安全高效的数据去重和密钥去重。随着云端存储的数据量的急剧增加,将会产生大量的重复数据。但是用户为了确保数据的保密性,通常会将数据先加密再外包给云。这样,相同的数据会被不同用户用各自的密钥加密成不同的密文,即重复的数据在云端看来是不重复的,这就阻碍了数据的去重。Convergent加密(CE)使去重成为可能,因为它可以把相同的明文加密成相同的密文。但是这会产生大量的convergent密钥,如果本地存储依然会消耗用户很大的存储空间,外包给云又会面临和数据一样的去重问题。为了解决convergent密钥管理问题,已经有几个去重方案被提出。然而,他们要么需要引入密钥管理服务器,要么需要数据拥有者之间的交互。本文利用基于身份的广播加密(IBBE)技术,设计了一个新颖的客户端去重方案Key D。用户在外包数据之前,先用CE对数据进行加密,再用IBBE对convergent密钥进行加密,然后将所有的密文都外包给云存储并在需要的时候从云端恢复。该方案不需要单独的密钥管理服务器,在数据上传和下载的过程中,用户只与云服务提供商(CSP)交互。形式化的安全性分析表明Key D确保了数据的保密性和convergent密钥的语意安全性,同时很好地保护了用户的所有权隐私。而且本文还通过实验与现有方案进行了详细的性能比较,证明该方案在存储开销、通信开销和计算开销之间实现了更好的权衡。(3)在物联网中同时实现了外包数据的聚合统计和细粒度访问控制。很多物联网设备尤其是穿戴设备,包含着大量的与用户健康等有关的隐私数据,但物联网设备的存储和计算能力都有限,所以物联网用户通常会将数据先加密再外包给云,而加密又会带来很多问题。首先,物联网用户可能希望除了云以外的具有某些属性的用户也能够访问他们的数据以提供更专业更全面的分析和建议。基于属性的加密(ABE)已经被广泛用于物联网外包数据的访问控制,但ABE无法实现对密文数据的聚合统计等计算。同态加密能够实现密文数据计算,但其低效率导致其在物联网环境中不够实用。本文利用Corrigan-Gibbs等人的聚合统计计算和密文策略的基于属性加密(CP-ABE)技术,设计了一个新颖实用的物联网数据外包方案。为了避免云服务器与大量的物联网用户频繁交互,成为整个系统的瓶颈,本文引入雾节点作为云和物联网用户的中间层。该方案同时支持对外包物联网数据的安全聚合和细粒度访问控制。用户在数据上传和恢复过程中只需承担少量的计算量。安全性分析表明该方案很好地保护了物联网数据的保密性。本文还给出了全面而详细的性能比较,证明该方案在客户端和雾服务器端都有更好的性能。(4)在多个私有数据集上实现了隐私保护的协同深度学习。随着大数据时代的到来,基于神经网络的深度学习以其前所未有的准确度成为建模、分类和识别复杂数据的热门方法,甚至还开始被用于疾病诊断和癌症识别。但是很多(医疗)机构和组织由于隐私问题和法律规定等原因无法共享数据集,而在单一数据集上进行训练往往会产生过拟合。为了能够在组合数据集上协作地训练模型,学者们提出了几种基于随机梯度下降算法的协作学习系统,使多个参与者能够在不共享其私有输入数据集的情况下共同训练一个模型。但是,它们中的大多数都需要一个参数服务器来维护全局参数。参数服务器通常被认为是诚实的,也就意味着它不会偏离协议。而且当参数服务器和学习参与者共谋时这些学习系统也是不安全的。本文利用ring allreduce技术和加法同态加密技术,设计了一个隐私保护的协同深度学习系统PCDL。系统中的参与者可以在不共享数据集的情况下实现协作学习,而且整个过程不涉及参数服务器或其他第三方。神经网络的参数只通过学习参与者之间的通信来更新。与以往的协同学习系统相比,该系统具有较好的安全性,能够抵抗共谋攻击,而且不会损失学习准确度。
其他文献
目前全球的数据中心数量已经达到800万座,传统的以交换机为中心的数据中心网络大多是基于树状的三层结构,这样的结构难以满足大规模数据中心的要求,为了满足日益增长的新需求,大量新型数据中心网络结构被提出。其中,BCube网络是一种采用递归定义,能支持数百万量级的服务器,它具有小直径、大容量和高容错性等的优良性质。数据中心网络可能包含数百甚至数千个服务器(结点),但是其中一些服务器可能时常会有故障出现,
随着大数据技术的不断发展,各种信息系统存储的数据越来越丰富,增加了数据分析处理的难度。主成分分析是一种标准的数据分析方法,可用来降低数据维度。更具体地说,它通过线性变换将原始高维数据投影到由数据协方差矩阵的特征向量组成的主成分空间来获得低维数据。主成分分析简化数据使得数据更易使用的同时降低了算法的计算开销。例如人脸识别时对图像进行降维,只保留某些关键像素可以使识别速度大大提升。金融数据和医疗数据里
木材断裂模拟是自然景观模拟中的一个重要部分。木材是一种复杂的生物有机体,加之不同树种其木材构造和木材物理力学性质的多样性、树枝内部构造的不规则性和复杂性,很难用传
以太坊(Ethereum)的出现极大地拓展了区块链技术的应用场景,使区块链技术不再局限于支付场景,从而成为区块链2.0的代表,受到了广泛关注。但是当前以太坊的吞吐量低,不能及时
约束的布局问题源于许多实际的工程问题,例如卫星舱载荷装填设计,运输路线设计,工业厂房和设备的布局设计,先进的设备制造以及钢铁企业板材设计。本文讨论了具有性能约束的多
人的头发重建是计算机图形学领域长期研究内容之一,是虚拟现实、虚拟试衣、游戏角色造型等应用的关键技术。然而,头发几何复杂,发型多样,使得快速重建高精度头发模型仍充满着
随着互联网技术的飞速发展和智慧城市的提出,人工智能的发展也越来越迅速。作为人工智能方向的核心研究领域,不确定性推理在人工智能发展中有着重要的作用。近年来,可信度推
目的北京市自2009年6月1日正式开始对全市0~6岁儿童实施发育性髋关节脱位(DDH)的筛查计划,现对该项计划实施11个月来的筛查结果予以初步分析和报告。方法2009年6月1日至2010年
会议
新型网络环境在云计算(Cloud Computing)等新型计算模式的推动下快速发展,并成为各类产业应用的关键基础设施。具体而言,海量数据不断地从物联网终端聚集到云服务器,推动了基
云计算技术是分布式计算、并行计算、网格计算等概念的发展与跃升,用户可以通过按使用量付费的方式快速、便捷、灵活的访问云平台上无尽的计算与存储资源。由于用户的数据被