浅谈大数据发布隐私保护技术

来源 :教育周报·教育论坛 | 被引量 : 0次 | 上传用户:randomx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着大数据时代的到来,大数据中蕴藏的巨大价值得以挖掘,同时也带来了隐私信息保护方面的难题,即如何在实现大数据高效共享的同时,保护敏感信息不被泄露。
  数据安全是信息安全的重要一环。
  大数据发布隐私保护技术
  匿名技術:数据持有方在公开发布数据时,这些数据通常会包含一定的用户信息,服务方在数据发布之前需要对数据进行处理使用户隐私免遭泄露。一般的,用户更希望攻击者无法从数据中识别出自身,更不用说窃取自身的隐私信息。
  数据发布匿名:在确保所发布的信息数据公开可用的前提下,隐藏公开数据记录与特定个人之间的对应联系,从而保护个人隐私。实践表明,仅删除数据表中有关用户身份的属性作为匿名实现方案是无法达到预期效果的。现有的方案是静态匿名技术(以信息损失为代价,不利于数据挖掘与分析)、个性化匿名、带权重的匿名等。后两类给予每条数据记录以不同程度的匿名保护,减少了非必要的信息损失。
  一、 大数据中的静态匿名技术
  在静态匿名策略中,数据发布方需要对数据中的准标识码进行处理,使得多条记录具有相同的准标识码组合,这些具有相同准标识码组合的记录集合被称为等价组。
  k-匿名技术就是每个等价组中的记录个数为k个,即针对大数据的攻击者在进行链接攻击时,对于任意一条记录的攻击同时会关联到等价组中的其他k-1条记录。这种特性使得攻击者无法确定与特定用户相关的记录,从而保护了用户的隐私。
  l-diversity匿名策略是保证每一个等价类的敏感属性至少有l个不同的值,l-diversity使得攻击者最多以1/l的概率确认某个个体的敏感信息。
  t-closeness匿名策略以EMD衡量敏感属性值之间的距离,并要求等价组内敏感属性值的分布特性与整个数据集中敏感属性值的分布特性之间的差异尽可能大。在l-diversity基础上,考虑了敏感属性的分布问题,要求所有等价类中敏感属性值的分布尽量接近该属性的全局分布。
  这些策略会造成较大的信息损失,有可能使得数据的使用方做出误判。
  二、大数据中的动态匿名技术
  针对大数据的持续更新特性,有的学者提出了基于动态数据集的匿名策略,这些匿名策略不但可以保证每一次发布的数据才能满足某种匿名标准,攻击都也将无法联合历史数据进行分析和推理。这些技术包括支持新增的数据重发布匿名技术、m-invariance匿名技术、基于角色构成的匿名等支持数据动态更新匿名保护的策略。
  支持新增的数据重发布匿名策略:使得数据集即使因为新增数据而发生改变,但多次发布后不同版本的公开数据仍然能满足l-diversity准则,以保证用户的隐私。数据发布者需要集中管理不同发布版本中的等价类,若新增的数据集与先前版本的等价类无交集并能满足l-diversity准则,则可以作为新版本发布数据中的新等价类出现,否则需要等待。若一个等价类过大,则要进行划分。
  m-invariance匿名策略:在支持新增操作的同时,支持数据重发布对历史数据集的删除。
  三、大数据中的匿名并行化处理
  大数据的巨规模特性使得匿名技术的效率变得至关重要。大数据环境下的数据匿名技术也是大数据环境下的数据处理技术之一,通用的大数据处理技术也能应用于数据匿名发布这一特定目的。分布式多线程是主流的解决思路,一类实现方案是利用特定的分布式计算框架实施通常的匿名策略,另一类实现方案是将匿名算法并行化,使用多纯种技术加速匿名算法的计算效率,从而节省了大数据中的匿名并行化处理的计算时间。
  使用已有的大数据处理工具与修改匿名算法实现方式是大数据环境下数据匿名技术的主要趋势,这些技术能极大地提高数据匿名处理效率。
  通过大数据审计技术
  当用户将数据存储在云服务器中时,就丧失了对数据的控制权。为了防止数据在用户不知情的情况下被修改,可以采用云存储中的审计技术。云存储审计指的是数据拥有者或第三方机构对云中的数据完整性进行审计。通过对数据进行审计,确保数据不会被云服务提供商篡改、丢弃,并且在审计的过程中用户的隐私不会被泄露。
  可证明的数据持有模型(PDP):该模型可以对服务器上的数据进行完整性验证,该模型中挑战应答协议传输的数据量非常少,因此所耗费的网络带宽较小。
  可恢复证明模型(POR):利用纠错码技术和消息认证机制来保证远程数据文件的完整性和可恢复性。该模型面临的挑战在于需要构建一个高效和安全的系统来应对用户的请求。
  大数据挖掘隐私保护技术
  隐私保护数据挖掘,即在保护隐私前提下的数据挖掘,主要的关注点有两个:一是对原始数据集进行必要的修改,使得数据接收者不能侵犯他人隐私;二是保护产生模式,限制对大数据中敏感知识的挖掘。
  1、 关联规则的隐私保护
  这种保护有两类方法:
  (1)变换:修改支持敏感规则的数据,使得规则的支持度和置信度小于一定的阈值而实现规则的隐藏。
  (2)隐藏:不修改数据,对生成敏感规则的频繁项集进行隐藏。
  2 分类结果的隐私保护
  分类方法的结果通常可以发现数据集中的隐私敏感信息,因此需要对敏感的分类结果信息进行保护。这类方法的目标是在降低敏感信息分类准确度的同时,不影响其他应用的性能。
  3 聚类结果的隐私保护
  一个较好的方案是:先对原始数据进行几何变换,以对敏感信息进行隐藏,然后是聚类过程,经过几何变换后的数据可以直接应用传统的聚类算法进行聚类。
其他文献
摘要:在一直以来的教育教学当中,教师一直都扮演着引领示范的角色,会对所教学生产生直接而深刻的影响作用,一定程度上还决定着整体教学质量的优劣,因此建设高素质的教师队伍就成为了促进教育教学发展的关键。  关键词:高职学校;师德师风;优质策略  高职学校的教育教学任务主要是为社会培养高素质的综合应用人才,而要想切实达成这一目标,各个院校势必就需要依靠一批批奋斗在一线的教师,那么关于教师的培养建设活动也就
期刊
摘要:培智小学生有着一定的智力障碍,其相较于正常人而言,对生活的适应和对知识的感知更为迟滞。但基于二者活动对其生存与发展的必要性,慢于、精于正常节奏与密度的生活与与知识渐入性教育亦便成为培智教师所需进行的重点教研话题。本文便将就基于培智学生特点的生活语文“渐入式”教育做出分列生活情境引讨论、情境演绎促辨识、阅读学习深认知三方面的阐述。以让培智学生在基本的生活适应基础上,再通过语文故事逐步进入信息认
期刊
摘要:教学是在整个教育体系中占有重要位置,它不仅是在学校工作中占主体地位,而且还是每个教师的责任与义务,优秀的教育更是为学校培养了大批栋梁之才。那么怎样才可以做到优秀教学呢?那就是课堂教学了,课堂教学地位显著,它是教学工作的重中之重,是教学工作的要点与重点,学生在课堂教学中了解并学习各式知识,提高自己的学习能力与综合素质,提高自己的思想境界,所以说,课堂教学是提高学生综合素质的重要途径。如果将课堂
期刊
【摘要】在微时代,高校思想政治教育脱离了传统思想政治教育陈旧的环境,进入了全新的环境。本文探究了有利于高校思想政治教育在微时代新环境下发展的新模式的构建:打造微平台,创造微产品,探讨微话题,加强监管。  【关键词】 微时代 高校思想政治教育 大学生  随着微信微博抖音等多功能新媒体的广泛运用,我们进入了微时代,社会各个领域都发生了翻天覆地的变化。微平台、微文化、微话题都是微时代的产物,利用好这些微
期刊
摘要:课前活动不但能较好地激发学生学习英语的兴趣,而且能营造活跃的课堂气氛, 激活学生的思维, 并培养合作精神。用课前5分钟,听、学、唱英文歌曲,学生可以从中构建基本的语音知识,提高听力、口语,培养语感,掌握部分语法知识,了解英语国家文化,最终具备基本的英语学科核心素养。  关键词: 课前活动;英文歌;英语;核心素养   音乐是世界通用的交流方式,语言不通的人之间也可以通过基旋律产生共鸣。语言的学
期刊
【摘要】改进作文批改方法,培养学生的写作能力是提高作文教学效率的有效途径。一、转变观点,正确认识作文批改。(一)老师要走出作文批改的误区,引导学生学习修改作文。(二)提高学生对作文修改的认识,养成修改作文的习惯。二、专注讲评,培养自评自改能力。首先,教师认真评析学生的作文。面向全体,重视个性差异。其次,教给学生修改的方法,“使学生能自改其文”三、热情鼓励,培养修改的习惯。  【关键词】效率 作文教
期刊
摘要:随着新课标的提出,以及教学改革的深入发展,学科核心素养成为众多教育者的热议话题。在高中生物教育中,教师需要将生物核心素养渗透在教学中,让学生在耳濡目染中,增强自身的生物学习能力,同时也可以丰富生物视野,促进自身的全面发展。本文以“聚焦核心素养,打造高效生物课堂”为题,将以科学素材为媒介,培养学生生命观念;以科学论证为方式,培养学生科学思维;以合作探究为载体,培养学生科学探究;以情境实践为途径
期刊
摘要:教学效果是教学活动所产生的收益,提升小学数学的教学效果是每位教师都必须不懈努力和奋斗的目标。但传统应试教育等传统教学观念和思想的影响,当前有很多的小学数学教师将教学重点放在了学生成绩提升上,一味地对学生进行知识灌输,导致学生的学习兴趣不高,课堂教学效果也因此得不到有效优化和提升。对此,本文将从构建恰当的问题情境、通过多媒体创设数学情境和紧密贴合生活实际三个方面出发,系统地分析和论述提升小学数
期刊
摘要:随着社会的不断发展,智能手机已经成为人们生活中的重要组成部分,而品牌接触点也在随着社会的变化而不断进行创新和改革,接触点的管理难度也在逐渐提升。因此本篇文章就以星巴克第四空间为例来介绍了品牌接触点的传播和管理等内容。  关键词:星巴克 门店 触点管理 用户体验  一、品牌触点管理的意义   品牌接触点管理的概念最早是由北欧航空公司的总裁来提出的,他认为只要用尽全力在给顾客留下好印象的地方努力
期刊
摘要:家校合作是一种家庭教育与学校教育相互配合的双向循环活动,为了学生的发展,家庭教育与学校教育必须联合起来,形成一股强大的教育力量,为学生的发展奠定坚实的基础。由于家庭环境千差万别,每位家长的教育理念不同,教育孩子的方式也不同,但家长和教师希望孩子健康成长的愿望是相同的。  基于这一理解,朝阳一校沈北分校极为重视家长的力量,引领着极富热情的活力家长,共同为沈北朝阳一活力宝贝的幸福而努力奋斗。走进
期刊