提供差分隐私保护的线性查询新方法

来源 :复旦大学 | 被引量 : 6次 | 上传用户:asd2303690
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
差分隐私是一种处理敏感数据分析任务时的隐私保护原理,在许多的场合下都得到了成功的应用。差分隐私与许多更早的隐私保护原理不同,它定义了十分严谨的隐私担保形式,并要求其数据分析技术都能够从数学上严格证明满足所定义的隐私担保。简单来说,差分隐私在数据发布过程中对任何个人敏感数据参与发布过程所招致的风险进行了定量的控制,从而使任何攻击者都无法从发布结果推断出任何单个参与者的敏感信息。目前,研究者们已经对差分隐私进行了大量的研究工作,并提出了许多有效的敏感数据分析方法。然而,差分隐私作为一个新的研究领域,仍然有许多新的问题有待解决。在这篇论文中,我们提出了三种在差分隐私下进行数据查询的新方法,显著提高了敏感数据查询的效率与有效性。实现差分隐私的一个最简单有效的方法是Laplace机制,它通过往查询结果中引入独立同分布的Laplace噪声来隐藏个人信息。虽然这个方法十分简单且被广泛应用,但它却要求查询结果对个体参与者的全局敏感度必须是有限而且较小的。对于许多复杂查询,例如SQL查询结果上的聚合以及子图计数,查询结果却很可能有着过大甚至无限的全局敏感度。现有的差分隐私机制并不能够处理如此复杂的查询。我们首先提出了一个基于经验敏感度的查询机制,它可以处理跟个体参与者之间有着复杂关系的查询,并且允许查询有无限大的全局敏感度。除此之外,我们的机制还能用于处理任意的子图计数查询并实现节点差分隐私,而这在过去是无法做到的。对于许多线性查询,Laplace机制所引入的独立噪声并不是最优的。为了优化查询精度,一些机制往查询结果引入相关的噪声来减小所需噪声的大小。然而,当查询序列是用户任意给定时,这些机制为了找到最优的噪声分布需要的计算开销非常大,随数据维度增加呈指数增长。因此,这些机制在实践中无法用于高维数据集。我们提出了一个基于子敏感度概念的改进机制,它不但可以通过往查询结果引入相关的噪声来优化查询精度,且其计算开销随数据维度增加仅呈多项式增长。因此,它在实践中的效率和可用性跟以往的方法相比有着显著的提高。最后,我们提出了一种用于整合所有已知查询结果的后处理技术,以利用查询中隐藏的冗余性和相关性来提高查询的精度。我们的方法还可以在隐私预算完全耗尽的场合下根据已知的信息给新查询返回有意义的估计结果。这个方法的一个重要优点是,它避免了在整个数据域上显式地构造柱状图,对于许多重要的查询类型它的计算开销随数据维度增加仅呈多项式增长,因此可适用于高维数据集。
其他文献
以乌库尔其-扎吉斯坦、扎吉斯坦-朗卡2个三级水文地质单元的中下侏罗统水西沟群地下水铀数据为研究对象,分析其数据分布形式,与整个盆地南缘地下水铀背景值进行对比,利用数理
七、液压系统的设计在了解了液压传动系统中的各种常用元件和辅件的结构、性能和它们的用途后,将它们适当地有机组合在一起,便能构成各种各样的液压系统来实现机器所要求的
一、江苏省通信设备、计算机及其它电子设备制造业发展概况通信设备、计算机及其他电子设备制造业是制造业中比较重大的行业,在国民经济中具有重要的地位。江苏的通信设备、
本文在对中国外向FDI的发展现状进行分析的基础上,指出中国外向FDI发展中存在着投资规模、投资结构、经营管理、制度法规和人才等方面的问题,并从投资主体、产业选择、区位选
我国油脂设备存在的机械问题有:主要转动件、特殊转动轮和齿条、机械密封、专用链条等质量差;在自动化方面,设计人员对工艺和设备性能了解不够,主要的控制元件和仪表如长期运行时
目的探究超早期小骨窗微创脑出血清除术治疗高血压脑出血的疗效及预后分析。方法选取60例高血压脑出血患者进行研究。随机分为观察组和对照组。观察组30例,采用超早期小骨窗
命名实体识别的目标是识别文本中事物的名称并分类。传统命名实体识别任务主要识别人名、地名和机构名等。但由于传统命名实体的类别有限,不能完全满足自然语言处理领域其他任
个人重整是一种再建型的个人破产程序。个人重整程序和个人破产和解程序虽然具有一定的共性,但只有同时满足具体方案不需要获得所有债权人的同意和具体方案中包括将来清偿或
在丙烯酸树脂链中引入亲水性基团 COOH 及 OH ,从而形成了具有水溶性的丙烯酸树脂 ,并讨论了亲水单体含量对树脂水溶性的影响。
建设行业对我国现代经济发展具有重要的推动作用,信息化技术是推动建设业前进的关键,国家应大力支持信息化技术的蓬勃发展,充分利用信息化技术,以此来提升行业技术水平。建设