论文部分内容阅读
位置大数据被广泛应用于智能交通、物联网、车联网、基于位置的服务系统等大数据热门领域,且与个人生活习惯、健康状况、兴趣地点、经济条件等隐私信息密切相关。划分发布是位置大数据统计信息发布的一种有效形式,通过添加满足差分隐私模型的随机噪声,可以实现对发布位置大数据的隐私保护,进而提高位置大数据的应用安全性。本文针对位置大数据统计发布环节的隐私保护问题,分析了位置大数据统计划分发布的过程和隐私保护的实现方法。为了充分利用位置大数据的时空相关性、提高发布数据的可用性,提出基于采样和调整的位置大数据差分隐私划分发布方法。首先,通过固定时间间隔的均匀采样实现位置大数据快照的连续发布,设计差分处理方法来减少相邻数据快照之间的时间和空间冗余,从而降低需要处理的数据量以提高数据发布算法的运行效率。然后,根据差分处理的结果确定更新数据对划分结构的影响程度,由此设计了基于网格结构和树结构的划分调整方法。最后,通过向调整后的划分结构添加拉普拉斯噪声,实现对发布位置大数据统计信息的差分隐私保护。通过对合成与实际位置大数据集进行实验并分析表明,本文提出的调整算法在提高算法运行效率和范围计数查询精度方面具有较大的优势。为了使得发布数据更好地体现位置大数据动态变化的特征以满足用户对位置统计信息的动态查询需求,提出基于PID控制器的位置大数据自适应采样机制和差分隐私划分发布方法。首先,根据均匀时间间隔采样位置大数据,得到实际数据快照;并按照最大运行边界和最小运行边界对下一时刻发布的位置大数据进行预测,得到预测数据快照。然后,在同一划分区域下,比较预测数据快照与实际数据快照之间的计数值,从而得到反馈误差;根据反馈误差引导PID控制器对采样间隔进行自适应调整,以确定合理的位置大数据采样时刻。最后,设计启发式四叉树划分方法和差分隐私预算分配及后置调整策略,实现对二维区域的合理划分和对发布数据的差分隐私保护。通过对实际位置大数据集进行实验并分析表明,本文设计的自适应采样机制可以有效地跟踪位置大数据动态变化的趋势,差分隐私预算分配和后置调整方法在保证隐私保护强度的前提下改善了范围计数查询的精度,提高了发布数据的可用性。