基于敏感度分层和新型l-diversity的信息低损耗匿名算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:turandeji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的应用范围越来越广,渗透到了人们生活的方方面面,随着互联网的普及带动了数据挖掘技术的迅猛发展,企业及科研机构也同样希望能在网络大数据中获得更有价值的信息。同时越来越多的人依赖互联网,然而,他们常常不经意地把基本的个人信息(如邮政编码、出生日期、性别等)留在互联网上。同时,数据挖掘的发展也促使着越来越多的企业或组织多途径的收集数据,以发现其中潜在有价值的信息但是公布的数据通常包含个人的私人信息,例如为了研究某些疾病而公开发布的医疗记录。这些发布的数据表中通常包含个人的敏感属性,如果发布者并不重视,未对数据表做出匿名处理的话,则很可能危害到个人的安全造成患者隐私的泄露。因此,在公开之前,应删除所有可以直接链接到个人的信息,并且要对其他的非敏感属性也同样做必要的泛化处理以抵御同质性攻击及偏斜型攻击等风险,这就引发了数据表匿名隐私的研究热潮,越来越多的专家学者们不断推出新的更具安全性和有效性的匿名模型。数据分析和数据挖掘是当前科学研究必不可少的一项工作,许多组织越来越多地收集和发布数据来进行数据分析和科学研究,但是当数据发布者发布信息的同时,如果没有应用合适的方法进行数据处理,可能会导致个人的的泄露或者不必要的信息损失。近年来,在发布包含敏感信息的数据时,个人的隐私保护受到了重视,现有的隐私保护方案k-匿名模型可以很好地避免身份泄露,但是在背景知识攻击下,它并不能提供足够的隐私保护。1-diversity模型改进k-匿名方法来阻挡同质性攻击取得良好的成效,但是l-diversity的改进过程还有很多没有考虑的问题,由于其自身的缺陷在处理数值型敏感属性效果不是很好,并未考虑敏感度的问题,可能导致同一等价类中高敏感度值存在过多的情况,容易遭到偏斜型攻击,其采用基于概念层次结构的数据概化策略,必然会导致过度泛化,从而导致信息损失率升高,数据可用性降低,使得研究成果不明显,甚至出现错误。本文着重于提高信息可用性和安全性,以及选择适合的聚类方法来对初始数据集进行处理,使得同一等价类中各个元组间尽可能相似,所提出一种l-sensitivity-level匿名模型,是鉴于前人的探索,基于敏感度层级划分改进基于聚类l-diversity的方法,分析了属性泄露的原因,充分考虑了敏感属性的语义,对隐私保护给出了更明确的定义。首先将敏感属性值按照敏感程度高低分为不同层次,然后根据敏感属性对记录进行分组。文中给出的实验结果证明了该方案的可行性。在保证有着更高级的隐私保护的基础之上,数据的泛化程度最小,数据泛化程度更低,进一步提高数据可用性。
其他文献
聚偏氟乙烯(PVDF)膜由于其机械强度高、介电常数高、热稳定性好等优点在众多分离膜中脱颖而出。然而,在超滤过程中,PVDF膜由于其高疏水性而容易结垢,抗污染能力较低,导致膜的使
2017版普通高中物理课程标准的颁布使高中物理教学改革深化进入了一个新阶段。如何落实物理学科核心素养的教学探索成为研究热点。本文选择在物理教学中体现高阶思维培养,对
在森林生态系统中,要对森林的可持续经营进行研究我们首先要考虑的因素就是森林更新,其更新的方式与进程将会对森林的群落水平与结构造成不同程度的影响。更新幼苗的成长则是整个森林更新进程至关重要的部分,而高生长量是衡量幼苗更新水平最为直接的指标。当前对更新幼苗的研究主要集中在地上部分,但是植物苗高生长是由地上和地下部分共同决定的,研究表明激烈的根系竞争会显著影响幼苗的生长发育,所以探究根系竞争对于更新幼苗
随着现代经济和科技水平的迅速发展,无论是航空公司还是机场都在与时俱进,由于我国航空业得到了飞速发展,随之民航的客流量也不断增长,因此能够在枢纽机场航站楼环境下提供精准定位功能的旅客智能服务系统的需求与日俱增。目前针对国内机场环境,国内的研究者多数利用无线网络通过对空中无线信号传播模型进行研究,在不增加无线网络硬件的基础上通过算法研究来进一步提高定位精度。随着机场的扩建其建筑面积巨大,枢纽机场旅客吞
梯度线圈是核磁共振波谱仪的重要部件之一,主要用于实现自动匀场和谱学脉冲梯度检测技术,从而获得更好的信号质量和更多的检测信息。近年来非线性梯度和微流控核磁共振检测开启了核磁共振领域的新方向。Z2梯度线圈能够为iMQC等谱学新方法提供新的检测信息,提高谱图分辨率。微流控核磁共振技术能够进行微量样品的原位化学反应中间产物检测和细胞代谢分析。商用的超导脉冲核磁共振波谱仪梯度线圈可用空间有限,不适合微流控芯
低场核磁共振技术(LF-NMR)主要是以氢质子为探针研究分子间的迁移运动,在低场核磁共振检测分析中,常用横向驰豫时间T2反映分子的运动过程。通过测定样品中分子横向弛豫时间表
双腔室钢管混凝土柱是一种新型的加强型钢管混凝土构件,能较好的解决常规截面大长宽比矩形钢管混凝土柱在推广应用中所存在的钢管易发生局部鼓曲、对内填混凝土的约束作用较
永磁同步电机因具有效率高、功率密度大等优点而广泛应用于生活中的各个领域,在现代交流伺服传动系统中,电机转子位置的准确获取是实际高性能控制的重要环节。在众多位置传感器中,旋转变压器具有结构可靠、抗干扰能力强、适用于环境恶劣的场合等优点,实际中得到了广泛应用。但由于安装、环境等因素的影响导致位置传感器故障,易造成控制系统崩溃等严重后果。为保证可靠性,需要能够及时诊断出位置传感器故障并对故障进行处理。因
在长期的运营管理与线路维护过程中,需要定期对轨道交通全线隧道的建筑限界和设备限界进行检查。传统的接触式测量方法不仅检测效率低、数据不易保存,而且需要动用较多的人力
目的:与传统双吻合器技术(double stapling technique,DST)相比较,探讨中高位直肠癌患者行腹腔镜直肠前切除术中切除“狗耳朵”技术(即改良双吻合器技术,modified double sta