云环境中隐私保护聚类数据挖掘的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhangyongqiangis250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据的爆炸式增长,资源受限的用户在本地进行数据挖掘的任务越来越困难,为了节省成本和提高挖掘效率,用户选择将数据挖掘任务外包给具有强大计算能力和大量存储空间的云服务器。然而,在云环境中对数据进行挖掘时,一些数据的敏感信息会被泄露。因此,如何在保证数据的隐私性不被破坏的情况下来对数据进行挖掘是至关重要的,并且已经成为了一个研究热点。本文将结合密码学相关知识对隐私保护的聚类数据挖掘进行研究,主要做了以下两个方面的工作:1、提出了可动态调整的隐私保护聚类数据挖掘方案。该方案允许云服务器在加密的数据集上动态调整聚类的个数并且恰当选取初始的聚类中心,在保证了数据的隐私性和聚类的精确度的同时也提高了聚类效率。在隐私保护的聚类方案中,由于K均值算法需要提前确定聚类的个数和初始聚类中心,而对于没有经验的数据拥有者需要大量的计算。为此,我们将这些任务交付给具有大量计算的云服务器,以此来减轻数据拥有者的计算负担。数据拥有者采用轻量级的对称加密算法将数据加密后上传到云服务器,云服务器将动态调整聚类个数,并将确定的聚类个数和初始聚类中心发送给数据拥有者。通过对该方案的分析和证明,验证了本方案在减少数据拥有者的计算量的同时聚类的精确度没有发生变化,而且是安全高效的。2、提出了多密钥下更安全的外包的K均值聚类方案。该方案允许数据拥有者使用自己的公私钥将数据安全地外包给两个不共谋的云服务器,并且允许云服务器能够处理不同密钥下的加密数据。为了保证数据的隐私性,我们采用具有双重解密性质的加法同态密码来加密数据。然后,构造了一个安全的密文乘法协议,使得参与该协议的两个不共谋的云服务器完成密文的乘法运算,而不会泄露关于原始数据的任何信息。接着,利用密文上最基本的加法和乘法子协议构造了安全的密文转换协议、安全的欧式距离的平方协议等子协议,并且通过构造的子协议来完成隐私保护的聚类数据挖掘任务。此外,数据拥有者采用对称密码系统将加密的数据库再次加密发送给云服务器,防止拥有主密钥的云服务器解密数据拥有者的密文。该方案中的数据拥有者和询问用户能够用自己公私钥加密数据且不参与聚类挖掘过程。该方案通过对每个子协议进行分析讨论,证明了我们的方案是安全的。最后,我们对比了目前的隐私保护的K均值聚类数据挖掘方案,表明了我们的方案是最优的。
其他文献
在北半球温带森林植物区系中,东亚比同纬度北美、欧洲地区体现出更高的生物多样性,例如,鹅耳枥属共约50种,其中46种分布于东亚地区,但目前对于该属在东亚的多样性演化历史还不清楚。化石是植物在地质时期存在和演化的直接证据,对于认识植物的多样性演化具有不可替代的作用。本文系统的研究了滇东南马关地区下中新统地层中发现的33件鹅耳枥属苞片化石标本,对其属种分类特征进行了详细的比较、讨论,识别出鹅耳枥属6种,
目前高清数字电视已经在我国全面普及,4K超高清数字电视将会成为下一个热点。而从高清到超高清的过渡存在一些问题需要解决。首先现有的视频源大多数分辨率较低;其次,超高清
目的:探讨周围神经显微减压术治疗上肢透析相关周围神经病(DRPN)的疗效。方法回顾性分析2017年1月至2017年12月中日友好医院神经外科收治的15例上肢DRPN患者的临床资料。15例
随着工业4.0时代的到来和《中国制造2025》的制定,我国工业逐步向智能制造领域发展,由制造大国向制造强国转型。在传统机械制造业物料需要人工进行搬运,在物料搬运过程中需要
图像在获取过程中,由于成像设备工艺缺陷、成像距离、大气干扰、运动等因素的影响,导致图像降质,影响图像的使用价值。超分辨率技术基于现有的成像设备,通过软件后处理的方法
高速发展的数据应用技术让数据的潜在价值得到了充分的利用,但是新的数据挖掘模式和攻击手段的出现使得传统的隐私保护方式变得不那么安全可靠了。一方面,数据拥有者在发布数据时需要对隐私信息进行保护处理;另一方面,发布后的数据会面对各类数据挖掘应用和隐私攻击的威胁。此时,如何设计具有强力隐私保障的算法成了难点问题。针对上述情况,差分隐私技术从根本上解决了这个问题。它不关心具体的应用背景,即使在最坏的情况下攻
辽宁省青城子矿集区是辽东-吉南成矿带上一个重要的铅锌多金属矿田。区内主要出露元古代大顶子岩体,印支期新岭岩体、双顶沟岩体,燕山期姚家沟岩体;主要产出新岭钼矿、姚家沟钼矿、榛子沟式层状铅锌矿、榛子沟式脉状铅锌矿、高家堡子碎裂大理岩型银矿、高家堡子独立银矿。新岭钼矿主成矿阶段流体包裹体类型主要有富液相包裹体、富气相包裹体、含CO_2三相包裹体、含子矿物包裹体、纯CO_2包裹体。其流体包裹体均一温度集中
随着媒体技术和信息网络的发展,数字电视视系统和显示设备对图像信号的质量要求越来越高。海量的原始数据经压缩后能够方便的用于传输和存储,然而高压缩率不可避免地造成信息损失。低码率下的解码图像会产生严重的模糊和块效应,大大降低了图像质量。压缩图像后处理是一项针对压缩后严重失真的图像,去除压缩产生的人工痕迹的关键技术。在图像成像方面,随着传感系统的发展,近红外光谱图像得到广泛的应用。在诸多应用场景下,例如
本文主要运用变分法研究一类p-Laplace分数阶脉冲常微分系统解的存在性和一类(p,q)-Laplace分数阶脉冲常微分系统解的存在性与多重性问题.全文共有四章,具体内容如下所述:第一章首先简要介绍本文所运用的方法,即对变分法进行简单的叙述;其次,概述所研究问题的历史背景及研究现状;最后,阐述本文涉及的基础知识.第二章 研究p-Laplace分数阶脉冲常微分系统(?)解的存在性问题.在非线性项满
乌兰拜其铅锌银矿床位于大兴安岭中南段锡林浩特-锡林郭勒富铅锌-富银成矿带上,大地构造位置处于华北板块和西伯利亚板块之间的过渡地带,且靠近华北板块一侧,区域性NEE向二连浩特-贺根山深断裂从本区的北西侧通过。作者通过研究乌兰拜其铅锌银矿床地质特征和地球化学特征,取得如下成果:(1)矿床主要赋存于下白垩统白音高老组(K_1by)流纹质含角砾岩屑晶屑凝灰岩中,一部分赋存于上二叠统(P_3l)泥质粉砂岩中