事务型数据发布的隐私保护关键技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:q251208414
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每时每刻通过各类APP产生的大量数据,造就了大数据时代的超速发展。要想发现数据背后隐藏的价值,就需要在数据发布之后通过数据挖掘来发现。但与此同时也增加了个人隐私泄露的风险。因此,在数据发布之前进行个体的隐私保护就显得十分有必要。而事务型数据作为这些数据中一类,由于具有稀疏多维的特点,在进行隐私保护时具有一定的难度。因此,本文通过对已有针对事务型数据发布的隐私保护关键技术进行研究,从匿名模型和差分隐私模型两种隐私保护技术上展开探究,并解决差分隐私算法中存在的查询不一致问题。经过隐私保护技术发布的事务型数据,不仅要保证数据的可用性,还要保证数据个体的隐私安全性。本文的主要工作为:(1)在现有基于匿名模型的事务型数据发布隐私保护研究基础上,为明确界定事务数据表中的敏感项目与非敏感项目,提出针对事务型数据隐私保护算法(c,k)-匿名。先利用泛化规则将事务记录的每个项目泛化,生成项目记录泛化表,构造计数树,然后根据隐私需求,设定阈值c的值,利用计数树明确区分出敏感项目与非敏感项目,使非敏感项目满足k-匿名,保证一个等价类中具有相同非敏感项目的记录个数不少于k个,以达到保护数据个体敏感项目的作用。该算法有效保护了发布数据中数据个体的敏感项目泄露的问题。最后使用事务型数据集,证明了(c,k)-匿名算法的可用性。(2)在现有基于差分隐私模型的事务型数据发布隐私保护研究基础上,为提高较大区间的查询精确度,提出基于k-叉区间树的差分隐私事务型数据发布算法DPTDP。先将事务数据表划分为多个集合,每个集合用其划分意义下的计数值进行描述,将所有的计数值根据区间大小不同映射到一棵k-叉区间树上,通过给较大区间分配较少的隐私预算,给较小的区间分配较多的隐私预算,然后对每个节点值添加符合Laplace分布的噪声值,从加噪后的树中导出直方图发布数据进行数据发布。用事务型数据集进行验证,证明该算法提高了查询精确度,实现对事务型数据发布的差分隐私保护。(3)针对基于差分隐私模型的事务型数据发布隐私保护算法中存在区间查询不一致的问题,提出一致性调整算法CA。先将一组子集相交的区间查询映射到一棵满k-叉区间树上,其中同一层节点上的区间值不相交,再向树中每个节点添加符合Laplace分布的随机噪声,得到一棵差分隐私满k-叉区间树。将树进行一致性调整后得到满足一致性约束的满k-叉区间树,遍历调整后的满k-叉区间树,得到满足差分隐私区间查询一致性的数据。通过实验证明,CA算法实现了事务型数据发布差分隐私的查询一致性约束。本文研究事务型数据发布的隐私保护关键技术,包括匿名模型和差分隐私模型。对现有的k ~m-匿名算法和DPAV算法进行详细的分析和改进,并针对区间查询的不一致现象进行了一致性调整,通过证明和实验分析:本文提出针对事务型数据发布的算法具有实用性。
其他文献
高效发光的荧光化合物因应用广泛而受到人们的关注。正如大家所熟知的,许多有机荧光染料通常以固体或薄膜的形式使用。然而,许多发光体在稀溶液中发出明亮的荧光,在浓溶液中
在智能电网中,电力用户参与电力系统频率调节的主要方式是需求响应,自动发电控制(Automatic Generation Control,AGC)满足不断变化的用户电力需求,并使系统处于经济的运行状
一直以来,离子液体(ILs)的研究受到各个学科专家以及研究者的热爱与青睐。被称为“绿色溶剂”和“可设计溶剂”的ILs通过专家学者的研究,其研究成果广泛分布于各个与人类生产生
生物技术、纳米技术、单分子技术相结合的蛋白质纳米通道单分子分析技术已经成为跨学科研究的核心技术之一。以α-溶血素蛋白质七聚体α-HL分子为代表的纳米通道使这一技术在
近些年来,空间观测技术在卫星传感器、数据获取存储技术的进步带动下得到了快速发展,目前我们可以快速获取并存储海量的高分辨率遥感卫星图像,这些遥感图像已经成为我们人类
近年来,脉冲神经网络在智能计算领域的研究与应用越来越广泛,获得了研究者越来越多的关注。虽然脉冲神经网络的早期发展受到了传统人工神经网络的启发,但是其与传统人工神经
智能电网作为新一代电网,利用现代信息技术实现电力和信息的融合,智能电网能够以更有效的方式输送电力。信息通信技术在提高系统效率的同时,由于信息物理系统的复杂性的特点,
随着纳米材料及微机电系统的迅速发展,微流控技术在生物医学、化学分析和环境改善等方面呈现出广泛的应用前景。其中电渗流是通过外加电场驱动微液体在壁面上流动,形成扰动的
在如今的数据化时代,需要存储与共享的数据量急剧增长,所涉及到的用户也越来越多。用户在分享数据的同时,也更加重视数据的安全性及其访问控制,但传统的密文检索方式无法提供
由于全球能源消耗的不断增长和传统自然资源的日渐耗竭,人们对可持续能源转换和储存设备的需求不断提高。目前,各种能源设备如燃料电池、空气电池、太阳能电池和超级电容器等