论文部分内容阅读
人口数据对制定和完善社会政策、推动经济高质量发展有重要意义,人口数据蕴含着丰富价值的同时也具有高度敏感性,然而目前人口数据的发布方法不足以保证为用户发布查询结果时兼顾隐私性和数据可用性。随着社会对隐私保护问题的日益关注,差分隐私因其具有严格的数学定义和可量化的隐私泄露风险而逐渐成为学术界研究的热点,因此本文将在差分隐私保护下进行关于人口数据发布方法的研究工作。首先,本文介绍了人口数据目前的主要发布方法和常见攻击类型,之后对传统数据发布隐私保护技术存在的问题进行分析,然后详细介绍了差分隐私的定义、性质和发布框架等概念。其次,本文设计了一个基于分级控制的差分隐私人口数据发布方法HC-PRDP。HC-PRDP方法采用区块链和差分隐私技术加强人口数据发布时的安全性和隐私性。HC-PRDP方法中访问控制层利用智能合约对用户分级,并将该交易在网络上验证后添加到区块链上,之后把用户权限传递给差分隐私层。差分隐私层根据用户权限值、用户信誉值和数据保护程度的差异获取不同隐私预算,为用户提供分级查询,实现对用户发布可用性不同的数据。此外,针对常见的统计查询方式,HC-PRDP方法中实现了满足差分隐私的均值查询、top-k查询和直方图查询,最后通过实验验证了 HC-PRDP方法的隐私性,以及对不同用户发布数据的可用性。最后,针对直方图发布中随着查询范围增大使噪声累积,导致发布的数据可用性降低的问题,本文提出了差分隐私直方图发布优化算法OBA-HP。该算法通过对发布直方图过程中产生的误差进行分析,建立了添加的噪声与发布误差的关系式,利用导数的性质得到了发布数据误差最小时隐私预算的分配比例和分组结果之间的公式。并通过理论分析证明了算法的隐私性,最后通过对比实验证明OBA-HP算法可以提高发布数据的准确性。