基于贝叶斯网络的差分隐私保护数据发布

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:nsldp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联技术及应用的深入和发展,许多公司、组织(如搜索引擎公司、电子商务企业或Internet服务提供商)提供便捷服务的同时也会收集海量的用户行为数据用于发布、统计、分析和挖掘等,然而,用户敏感的信息往往就存在于这些数据中。因此,在对这些数据进行发布、统计前需要对其进行隐私保护处理,以防用户隐私数据的泄露。差分隐私模型是现今使用最广泛的受隐私保护的数据发布技术,该模型以其出色的性能应用于许多隐私保护场合,主要通过向原始数据中添加噪声来实现隐私保护。然而,面对高维数据时,现存的隐私保护算法通常注入过大的噪声,使得发布的数据过度失真而具有较差的的准确性和可用性,因此,在满足差分隐私约束的基础上,如何提高发布数据的有效性和实用性是一个主要的难点。由此,本文所要研究的内容是基于差分隐私保护下的高维数据集的发布问题,研究目标为在满足差分隐私保护的前提下实现高维数据集数据发布的有效性和可用性(utility)。论文的主要贡献包括以下两个方面:(1)研究贝叶斯网络结构,针对现存贝叶斯网络模型的不足之处,提出一种基于互信息和K2评分函数相结合的带权贝叶斯网络模型。该模型通过对首属性的选择以及k值的确定,使得构造的贝叶斯网络中节点的低维边缘分布与高维数据集中属性的全分布高度拟合,提高分类准确性。(2)在贝叶斯网络模型既定的情况下,向数据集中添加噪音使其满足差分隐私保护。添加噪声时考虑属性字段的次序,并采取异方差加噪方式,使得数据集拥有一定的隐私性的同时,具有较高的可用性。(3)通过实验对生成的加噪数据集的可用性、安全性以及算法性能进行了佐证,和其他现存的一些相关类似算法进行比较,证明了本文提出的算法更优。图[13]表[7]参[55]
其他文献
蒋英,著名女高音歌唱家、声乐学家、声乐教育家。1920年9月出生于浙江海宁,1941年毕业于柏林音乐大学声乐系。历任中央实验歌剧院艺术指导和独唱演员,中央音乐学院声乐系教研
美联储主席伯南克6月19日表示:如果对美国经济的预测是准确的,那么美联储很可能在今年稍晚放缓资产购买,并于2014年年中结束量化宽松政策。连续实施了五年的美国量化宽松政策
目的观察输入性疟疾患者实验室检测指标的变化情况,为临床诊断、治疗和预后判断情况提供参考。方法回顾性分析80例确诊为输入性疟疾感染患者的血常规、生化指标结果,并与100
随着我国社会主义市场经济的不断发展,城乡地带的人民都选择外出务工,以便于寻求更好的工作岗位,谋求更好的待遇。这也就导致我国出现了这么一种人群——留守儿童。当下我国
今年1到4月份,在我国一些地区出现了几次因SARS疫情恐慌导致的抢购风潮,其特点主要表现为突发性、群发性和快速平息的短暂性.这些特点与人们的风险认知机制有关.研究表明,情
随着高校不断扩招,大学英语也开始实行大班教学,从而给教师带来了很多挑战,比如参差不齐的学生水平,日益冷淡的师生关系,纷繁复杂的课堂管理,学生冷漠的学习态度,以及堆积如山学生作
头孢妥仑匹酯(cefditoren pivoxil)是日本明治制果株式会社研制的第3代头孢菌素,后来划归为第4代[1].本品于1996年9月获得我国药品监管部门批准,2001年9月获得美国FDA的批准.
语言的表达,对于一名教师来说,相当于是一种工具。教师的教学设想和教学实践活动,都需要教师通过语言进行表达和传授,没有一口流利的普通话,没有幽默睿智的语言,难以保证教学
<正>上海,"四叶草"熠熠生辉,喜迎八方的来客。11月5~10日,首届中国国际进口博览会盛大开幕。中国主办,各国参与,万商云集,全球受益。人类贸易史上一座新的丰碑由此诞生。1500
近日,人力资源社会保障部、应急管理部印发《国家综合性消防救援队伍消防员招录办法(试行)》。《办法》公开发布之际,人力资源社会保障部事业单位人事管理司、应急管理部教育