基于差分隐私与网格聚类的位置数据发布算法

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:vivi8133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着智能终端的不断革新,基于位置数据的应用通过分析收集到的位置数据可以提高服务质量,但这些数据中往往涉及到敏感的个人信息。因此,位置数据在发布给第三方机构之前需要进行隐私保护。差分隐私技术不依赖于攻击者所具有的相关背景知识,能够为敏感数据提供严格的隐私保证,更适宜应用在数据的发布与查询过程中。目前应用差分隐私的位置数据发布算法尽管满足了隐私保护要求,但由于过多的噪声累加导致数据的可用性不高。为了解决此问题,本文提出两种改进方案。针对数据量小且数据分布较均匀的数据集,本文提出了基于阈值的位置数据发布算法。该算法在每层网格划分结束后,随机选取一个网格单元并查找其相邻网格单元,计算当前聚簇与每个相邻网格单元之间的计数值方差。对方差小于指定阈值的网格单元进行聚类,并向每个聚簇内添加噪声,然后将结果平均分配给聚簇内的每个网格单元,借此减少了由噪声累加产生的噪声误差问题。同时,根据噪声误差与均匀假设误差之间的关系给定了阈值的选取范围。针对数据量大且均匀性较差的数据集,本文提出了基于平方和误差的位置数据发布算法。该算法在每层网格划分结束后,先向每个网格单元中添加噪声并保留噪声结果。然后,再根据每个网格内的真实计数值进行网格聚类。聚类过程中,当前聚簇每添加一个新的网格单元,便向聚簇整体重新添加噪声并且均分噪声结果。分别计算直接添加噪声与真实计数值的平方和误差以及聚类后添加噪声与真实计数值的平方和误差,并保留平方和误差较小的噪声添加方式。在解决噪声累加问题的同时,进而减少了算法的运行时间。本文在真实数据集上对提出的两种改进算法与其他同类算法进行实验对比。实验结果表明,本文所提算法在满足差分隐私的前提下,可以很好的减少查询误差,提高查询结果的准确性,进而提高数据的可用性。
其他文献
寒冷地区复杂的水工环境给土石坝的服役寿命带来了极大的挑战,实际服役中面板混凝土由于长期与水接触造成的溶出性侵蚀会使混凝土内部孔结构恶化,进而影响面板材料的性能。近
进入信息化时代,我们每一个人都能感受到与信息相关的数据无处不在。我们在生产、生活、社会管理中每一天都在产生海量的数据,数据也在极大地影响和改变着我们的生产、生活方
港口码头工程作为重要的交通基础设施关键节点,是国家实施“一带一路”倡议的重要支撑工程。然而,“一带一路”沿线地震带分布遍及了大多数重要港口,同时地基液化是地震作用
航道通过能力可理解为航道疏导船舶的能力,是充分发挥港口整体功能的决定因素。对航道通过能力进行系统分析和研究,可为航道改扩建和港区规划设计提供重要依据,对改善航道通
番鸭呼肠孤病毒(MDRV)感染是由MDRV引起番鸭和半番鸭高发病率和高死亡率的急性传染病,给番鸭养殖业造成严重的经济损失。MDRV与鸡源禽呼肠孤病毒(ARV)同属于正呼肠孤病毒属(O
传统古村落一直是中华民族历史发展过程中的精华体现,有着许多传承多年的习俗,代表着古代人民智慧与劳动的象征。本文结合国内外的研究进展,阐述了传统村落的研究背景,总结了
地表城市热岛(SUHI)是建成区地表温度高于郊区地表温度的现象,SUHI产生的根本原因是景观城镇化所引起的城郊地表性质的差异,在建成区空间形态方面主要表现为城市规模、建成区
土壤侵蚀是导致生态环境恶化和土地生产力下降的重要原因,现已成为阻碍社会经济可持续发展的重大全球性生态环境问题。因此,治理土壤侵蚀,提高土地生产力显得尤为重要。迤者
因为我国《预算法》规定地方政府无法发债,但是地方政府面临城市基础设施建设资金需求的缺口,因此地方政府需要成立城市建设投资公司作为融资平台发行城投债以募集城市建设资金。城投债违约会直接降低城投公司的融资能力,但是,《担保法》规定了地方政府不能够为城投债提供显性担保,由于担保可以改变城投债信用风险,降低发行方的信用成本,增强发行方募集资金的能力以更好地推动市政建设,因此,地方政府存在为城投债提供隐性担
磁耦合无线电能传输技术(Magnetic Coupling Wireless Power Transfer,MC-WPT)可实现电动汽车边行驶边充电功能,从而解决电动汽车续航能力不足问题。分段式导轨为电动汽车供