面向数据发布的隐私保护技术研究

来源 :国防科技大学 | 被引量 : 3次 | 上传用户:kwok916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们正生活在一个大数据的时代,大数据给我们带来了新的机遇,但很多数据通常都表现出独特的行为模式和敏感信息,对原始数据的处理可能会侵犯其拥有者的隐私。美国在线(AOL)公司将搜索日志发布所带来的隐私泄露问题是一个典型的反面例子,其中部分用户的身份信息很快就被一家通讯社的记者重新识别并公布。因此,如何在数据发布前进行有效处理,在保持隐私性,安全性的同时提高数据集的可用性,对个人、企业保护其数据的敏感信息具有重要意义。已有的隐私保护研究主要集中在静态数据集的单次发布,但一方面现实生活中产生的数据更多地呈现动态变化的趋势,变化前后数据的敏感属性之间存在可能的推理关联,这将导致敏感信息的泄漏;另一方面,由于数据量规模的迅速增长,数据类型的繁多,越来越多的机构希望与他人共享各自的数据,从而获得更准确的处理结果,这也暴露出了更多的安全和隐私问题,例如如何保证通信安全以及防止多用户勾结进行攻击。因此,本文主要针对动态数据流发布和多用户协同数据发布中的隐私保护问题展开研究,主要贡献和创新点包含以下几个方面:(1)提出并实现了一种面向动态数据集发布的隐私保护策略定位技术的快速发展和基于位置服务的广泛应用,产生了大量与移动用户相关的轨迹数据集。为了避免轨迹数据集发布产生的隐私泄漏风险,本文基于(K,C)L隐私模型及滑动窗口机制,设计并实现了一种带敏感属性的动态轨迹数据流隐私保护机制TA-SA,能够实时对用户的轨迹信息进行匿名处理,于此同时保护用户的敏感属性不被泄露。该机制具备以下三个特点:一、这是一种用于动态轨迹数据流的匿名发布方法,能够有效避免动态数据发布中用户的轨迹信息因产生关联而导致隐私泄露的风险;二、提出了一种基于FP-tree的滑动窗口模型,有效降低了滑动窗口对存储空间的需求,同时提高了匿名算法查找轨迹数据的效率;三、添加了敏感属性的匿名方法,数据拥有者能够在保护用户轨迹信息的同时保护其相关敏感属性的隐私。(2)提出并实现了一种面向数值型动态数据集发布的差分隐私保护策略相对于直接发布个体属性的数据集,数值型统计数据集的发布是一种更为常见的发布类型。为了进一步提高数据集发布结果的隐私性并降低敏感泄漏的风险,本文针对大规模数据环境下攻击者背景知识难以衡量的特点,利用差分隐私保护技术的强保护性特征,提出了面向数值型动态数据集发布的隐私保护机制EG-Privacy。该机制能够对数值型动态数据集进行聚合发布,同时保证恶意攻击者无法从发布结果中推断出任何用户身份相关信息。该机制具有以下特点:一、完全脱离对恶意攻击者可能拥有背景知识范围的假设,差分隐私保护技术使得发布结果具有相当强的匿名性;二、基于w-event滑动窗口模型,实现了无限数据流的差分隐私发布,解决了传统算法中差分隐私机制难以应用于连续数据保护的问题;三、实现了一种针对数据加噪的分组优化策略,令数据根据变化程度大小进行弹性的加噪处理,进一步提高了数据发布结果的有效性。(3)提出并实现了一种面向协同数据集发布的隐私保护策略随着数据量的不断增多,单一数据拥有者的数据发布有时难以展现有价值的结果,更有效的方法是联合拥有相似数据的其他数据拥有者进行协同发布,然而多用户之间的协同数据发布也带来了更多的隐私问题。本文基于m-privacy模型,设计并实现了一种无可信第三方环境下多用户数据协同发布的匿名隐私保护机制MK-A,能够在可信第三方不存在的情况下实现多个数据拥有者联合共享各自的数据,同时保护数据的敏感信息不被泄露。该机制具有以下特点:一、有效解决了多用户间的合谋威胁,即使存在若干个数据拥有者同时也是恶意攻击者,也能保证最后发布的结果满足隐私保护的需求;二、设计并实现了一种不可信环境下多用户的安全数据交互协议,数据提供者通过对准标识符和敏感信息采取不同的匿名化传输方式,从而确保攻击者无法将准标识符内容关联至敏感信息。(4)提出并实现了一种面向数值型协同数据集发布的差分隐私保护策略多用户环境下的协同数据集发布虽然能够提供有价值的信息,但同时也增大了用户敏感信息被攻击识别的可能性,因此我们希望能够规避对攻击者可能拥有的背景知识的猜测。针对上述问题,本文采用分布式差分隐私技术以及安全多方计算协议,设计并实现了一种面向数值型数据集的多用户数据协同发布策略DFTA。该机制具备以下特点:一、将差分隐私技术应用于协同数据发布环境中,解决了多用户环境下攻击者背景知识更难以衡量的问题;二、采用多方安全计算协议实现多用户在安全环境下共同完成数据计算,同时避免任何一方的原始输入内容被其他用户获取;三、为应对数据拥有者可能出现意外故障的情形(如突然离线),设计并实现一种故障反馈机制,能够在不重启协议的情况下继续完成数据交互。
其他文献
随着全球化进程的加快,中外公司之间的跨境投资合作越来越频繁和深入。跨境投资大会为中外公司提供了一个很好的平台来协商和讨论未来的合作。第十九届中以跨境投资大会以“走进以色列”为主题,邀请了100多个以色列创新技术企业与中国企业进行对接,共商未来合作与发展。而笔者作为双方公司互相沟通的重要桥梁,为促进此次对接会中以公司洽谈成功起到了重要作用。本文是一篇基于目的论分析笔者在此次中以跨境投资大会中担任译员
<正>道教印诞生并风行于东汉,繁荣于盛唐直至宋元,时至今日,全国各地的道观中仍保留并沿用着汉唐时期的道教印。道教印是传统印章的一个重要组成部分,也是民族文化的一大创举
期刊
胎儿和新生儿溶血性疾病(HDFN)基本原因是指某些妇女在怀孕期间暴露于父系衍生的红细胞抗原或在其既往输血史中暴露于非自体抗原,红细胞致敏。一旦被致敏,未来怀孕可能导致HD
针对在不同数据集上的图像检索任务,提出一种有效的再训练方法,用于优化卷积神经网络(CNN)特征应用于基于内容的图像检索(CBIR)。为了实现这一目标,采用预训练的卷积神经网络
受访人:$$    大恒数码印刷(北京)有限公司总经理 李俊杰$$    大恒数码印刷(北京)有限公司副总经理 王 旭$$    北京顶佳印刷城项目总监 姚 松$$    日前,大恒数
期刊
当你在地铁站里看到《画皮2》的电影广告,一时冲动想去买票一睹为快时,用带有二维码识别功能的手机拍下广告牌上的二维码,你不仅可以直接登录到网站预订电影票,而且可以观看预告
会议
本文首次采用中国制造业企业层面的能源消耗和产出微观数据,利用细分能源类型的二氧化碳排放因子换算得到微观企业环境绩效指标,即单位产出的二氧化碳排放量(二氧化碳排放强
近年来,疯牛病、口蹄疫、禽流感、SARS等人畜共患的疾病在全球范围内频繁发生,引起多次公共卫生危机,对公众健康和经济社会发展造成严重威胁。  上世纪末,比利时因“二恶英”污染事件发生后,布鲁塞尔一份报纸《自由比利时报》曾经发表社论质问政府:“牛肉有激素,奶酪里含防腐剂,鱼被水银污染,现在肉鸡和鸡蛋里又出现了致癌物质,今晚我们该吃什么?”  动物产品安全性问题已给现代社会造成重大影响,远远超出传统的
期刊
面对愈加严重的能源危机和环境污染问题,开发可再生的新型清洁能源已经成为当今时代的重大议题。在此背景下,新型低成本高效率太阳能电池引起全世界研究者的巨大兴趣。近年来
2011年,山东正式迈入区域GDP“4万亿俱乐部”,进入经济发展第一梯队。与此同时,全球性的经济放缓也给山东企业带来重大挑战。一方面要承受劳动力和原材料的价格上涨,另一方面还要保持快速的发展势头。在区域的变化中重新定位,山东企业寻找着全新的内驱动力。  2012年7月,《计算机世界》报“信息化九州行”进入山东,走访了包括装备制造、石油化工、医药流通与生产等行业在内的多家企业。  信息化已然成为山东
会议