【摘 要】
:
在大数据高速发展的今天,对空间数据的收集处理需求越来越大,而在满足差分隐私保护要求的空间数据划分发布中,数据的分布特征是不容忽略的重要因素。当区间粒度选择过粗时由
论文部分内容阅读
在大数据高速发展的今天,对空间数据的收集处理需求越来越大,而在满足差分隐私保护要求的空间数据划分发布中,数据的分布特征是不容忽略的重要因素。当区间粒度选择过粗时由于数据分布的不均匀会引起划分误差过大,当区间粒度选择过细时数据分布相似则会引起噪声误差的累积,为解决区间划分与数据分布特征的适应性问题,本文提出了基于差分隐私的逻辑网格层次优化划分方法HOLG-DP(Hierarchical Optimization of Logical Grids based on Differential Privacy),该方法采用自下而上凝聚的思想,首先对数据集进行初始细粒度的网格划分,再根据数据分布相似度合并形成相对的“粗粒度”网格,对形成的新的网格单元内部区域根据查询贡献率的计算进行二次划分,最终构成三层层次模型。HOLG-DP方法提出逻辑网格单元的概念,解决了网格单元划分过细,网格单元数目庞大而直接导致的噪声累积问题;提出逻辑网格域的概念,形成逻辑网格单元的集合,对逻辑网格域进行层次模型的构建,并使用一致性约束处理内部结点,提高了查询的效用性。为降低HOLG-DP划分方法的时间复杂度,本文提出利用哈夫曼树来优化处理HOLG-DP生成的层次树,通过对相同类型的层次树构建哈夫曼树,使得在相同类型中分布面积较大的层次树的加权路径长度较短,从而实现在待划分发布的数据域上在保证了查询效用性的同时,有效地降低划分算法查询响应时间。本文为验证HOLG-DP以及利用哈夫曼树优化后的HOLG-DP方法的可行性,分别在实际数据集上分析不同阈值下其相对误差的变化情况;比较HOLG-DP方法与不同划分方法在相同的隐私保护预算下的查询结果的准确性,并通过比较在不同隐私保护参数下不同划分方法的运行响应时间,来验证利用哈夫曼树优化的HOLG-DP方法的可行性。两组实验中可观察到相对误差都有明显降低,发布的查询结果的效用性在一定规模的查询区域中有显著提高,后者能有效地降低运行响应时间。
其他文献
在人口激增的今天,世界范围的粮食危机越来越严重;石油、煤炭等矿物能源日渐枯竭,因此,寻找可再生的替代能源已成为全人类迫在眉睫的课题。天然纤维素拥有可再生、产量大、环
本文对莱州湾2014年5月和9月水文、化学和生物参数进行了综合分析,探讨了浮游植物群落结构与环境因子时空分布特征及相互关系。研究表明,两个月份的盐度、溶解性无机氮(DIN)
分布式驱动是一种新型的电动汽车驱动形式,所谓分布式驱动即通过四个安装于车轮的轮毂电机直接进行驱动。分布式驱动电动汽车由于具有传动链短,空间大且控制精确等优点,正在成为研究的热点之一,开展分布式驱动电动汽车的相关研究对于我国汽车工业的发展具有重要的意义。本文以分布式驱动电动汽车为研究主体,重点开展适用于分布式驱动电动汽车的驱动防滑控制策略研究。本文具体内容分以下几个部分展开:(1)介绍电动汽车的整体
锡林河是我国典型的草原内陆河,流域所处的锡林郭勒草原属寒旱区典型草原,常年干旱,降水稀少,是该区域的主要气候特征。降水的年内分布季节性明显,冬季降水量占全年降水量的比重较大,由降雪形成的季节性积雪是该地区重要的淡水资源,其春季的积雪融水又是地区性的地下水、地表水的主要补给来源之一,但降雪也会引起雪灾和春季草原融雪性洪水等自然灾害的发生,威胁草原牧区人民的生命财产安全,影响当地农牧业发展及生态文明建
说话人识别是用来进行身份确认的一种认证技术,通常也被称为声纹识别。它通过不同说话人语音中的个性特征来识别说话人身份,具有操作方便,设备成本低等优势,并被应用于证券银
本文以乌江中上游、清水江流域、麻山石漠化山区三个地区的民族田野调查资料为基础,证明生态失衡并非相关民族文化正常运作的结果,而是族际关系失衡或相关文化转型而诱发的灾
"拥吻图"是四川地区众多清代墓葬建筑雕刻图像中的另类,其位置显要,题材另类,引起诸多的关注和热议。本文在实地考察的基础上,对四川万源、宣汉多处墓葬的"拥吻图"进行了初步
随着数字信息与多媒体技术的不断发展,数字图像视频处理技术也取得了飞快的进步,特别是立体图像、三维视频,凭借其能与用户交互的功能以及强烈的视觉冲击感成为了研究热点。
随着高考制度的改革,高中学校的管理工作面临全新的挑战。鉴于此,本文主要就新高考改革背景下,学校管理需要面对的挑战以及如何做好应对工作展开有效分析。
设计了一个EC-AMR电涡流检测系统。运用基于有限元分析法的COMSOL软件对影响检测结果的主要因素进行仿真分析,并将结果应用于实验中。实验选择异向磁阻三轴磁场传感器HMC1043