【摘 要】
:
随着互联网技术和数据挖掘技术的发展,数据在不断的被生成、发布共享和使用,然而人们在享受着数据共享带来的便利的同时,也面临着隐私泄露的风险。如何保证发布数据的可用性及安全性是学术界不断研究的问题。本文围绕多敏感属性数据发布的匿名隐私保护问题展开研究,通过对研究现状的分析,指出现有模型的不足。第一,现有模型忽略了属性间的相关性,泛化所有非敏感属性导致数据隐匿率过高,信息损失量过大,数据可用性差;第二,
论文部分内容阅读
随着互联网技术和数据挖掘技术的发展,数据在不断的被生成、发布共享和使用,然而人们在享受着数据共享带来的便利的同时,也面临着隐私泄露的风险。如何保证发布数据的可用性及安全性是学术界不断研究的问题。本文围绕多敏感属性数据发布的匿名隐私保护问题展开研究,通过对研究现状的分析,指出现有模型的不足。第一,现有模型忽略了属性间的相关性,泛化所有非敏感属性导致数据隐匿率过高,信息损失量过大,数据可用性差;第二,现有模型没有实现有效的敏感属性值分级别保护。针对以上问题,本文提出了基于属性相关的敏感度分级(α,l)-多样性模型及其实现算法,具体工作如下文所述:首先,介绍隐私保护中的匿名化技术,并分别介绍了三个经典匿名模型,然后介绍将用于与本文模型做对比的两个面向多敏感属性数据发布的匿名模型。对多敏感属性数据匿名发布所面临的问题进行详细描述,提出了基于属性相关的敏感度分级(α,l)-多样性模型,该模型通过保护属性间的相关性,减小属性的泛化率,提高发布数据的可用性,并对敏感属性值分级别保护,提高模型的隐私保护强度。其次,本文给出了实现(α,l)-多样性模型的两个子算法。属性划分算法首先确定准标识符属性与敏感属性的相关性,对属性进行预处理,然后给出敏感级别定义的新方法,该方法根据多样性L定义敏感级别,使得定义后的敏感级别分布更均匀。基于频繁项集的匿名等价组生成算法,利用FP-growth算法思想,先构造前缀树,然后遍历前缀树生成等价组,能够最大限度的保护属性间的相关性,并且能够生成更为合理的等价组,最后通过泛化技术生成匿名等价组。最后,设计对比实验,选取真实的数据集,设置不同参数做对比实验。实验结果表明,本文提出的基于属性相关的敏感度分级(α,l)-多样性模型能够有效的减小发布数据的信息损失量,并且保护属性间的相关性,提高数据的可用性,同时敏感属性分级别保护提高了模型的隐私保护强度,基于频繁项集生成等价组的算法有更高的执行效率。
其他文献
推进以人为本的新型城镇化建设、推动1亿非户籍人口在城镇落户是实现城乡高质量发展的重要任务。在此背景下,更加需要研判农业转移人口的现实需求,从而剖析市民化进程的困难和阻碍。随着社会经济发展和物质条件的改善,教育逐渐在农村家庭的城镇化决策考量中摆在了最重要的位置。在基础教育资源的驱动下,农村家庭中的适龄入学人口和陪读家长在城镇聚集,教育相关人群在城镇人口结构中凸显,呈现出“书包中的城镇化”现象。本研究
在工业生产中,永磁同步电机因其结构简单、功率密度高、动态响应快的优点被广泛应用。传统的电机调速系统都是采用PI控制,但是易受到环境的影响。滑模变结构因其对参数扰动不敏感、鲁棒性强的特点开始逐渐替代PI控制应用在电机的调速系统中,但传统的滑模变结构的方法会使系统产生抖振,影响控制效果,所以设计出基于滑模控制的高性能的电机调速系统有着非常重要的研究意义。本文在传统滑模控制方法的基础上进行了改进,以实现
高中语文新课标强调学生的主体地位,要求教师改变教学理念与方式,创设情境,构建开放、多样、有序的课堂,引导学生以自主、合作、探究的方式学习。三元整合导学模式把培养核心素养作为根本目标,强化了教师的整合、引导作用,鼓励学生采取自主、合作、探究的学习方式进行学习。作为广东省国家级示范性高中、全国教育科研先进单位以及基础教育改革先进学校的广州市象贤中学自2009年开始探索三元整合导学模式,成效显著。201
大规模 MIMO(Multiple Input Multiple Output,MIMO)技术可以极大地提高频谱效率,提高系统容量,并成为了第五代移动通信系统的关键技术之一,受到了广泛关注。大规模MIMO系统的一个重要特点是,随着基站天线数量的增长,用户的信道将趋于正交。但是实际中因为传播环境缺少足够的散射,或者天线间隔过小,导致了用户信道之间仍存在相关性,使大规模MIMO系统性能下降。因此,用户
我国融资租赁行业自20世纪八十年代起步以来,经过相关国家法律政策的支持和行业的自我探索,融资租赁业逐步迈向成熟。但是随着融资租赁公司业务进一步扩张的需求,许多公司都
科技发展日新月异,电力体统的改革也是必然选择。随着改革的不断进化,电力公司不能只以单纯的电力生产为中心思想,要逐步的把重心转移到用电管理方面。其中,用电信息采集方面
目前我国经济情况积极向好,发展也越来越快,用电量也随之越来越多,所以电网的规模正在逐渐扩大,电网结构也越来越复杂,基于这种情况下,保证供电的稳定性、电力系统在安全的环境下平稳运行是非常重要的。在多机电力系统中较多采用静止同步补偿器,较多学者研究含STATCOM的多机电力系统的暂态稳定性问题,但在考虑约束的条件下是否还能保持稳定有待研究。本文主要研究的是含STATCOM的多机电力系统,考虑输出约束来
本文主要研究紧致的 λ-超曲面上一类散度型椭圆算子Lr的三种特征值问题:Dirichlet特征值问题;闭的特征值问题和clamped plate问题.借助一族合适的试验函数,我们得到了算子Lr的高阶特征值和低阶特征值的上界估计.特别地,当λ=0时,就得到了紧致的self-shrinker上的相应特征值问题的特征值估计.因此,我们的结果推广了紧致的self-shrinker上的一些结果,而且,当r=
目前,甲状腺癌症已经成为世界上癌症发病率增长最快的癌症之一。对甲状腺癌进行早期诊断可以显著降低患者死亡率,借助甲状腺穿刺细胞病理WSI进行病理观测是进行早期诊断最为有效的方式。然而,在甲状腺穿刺细胞病理WSI中,有效诊断滤泡区域面积占比极小且分布散乱,微小病灶和早期病灶易漏诊。随着病例数量急剧增多,病理医生面临着工作压力增大及误诊率升高的风险,因而研究高准确度甲状腺自动细胞病理诊断技术意义重大。据
Si O_2气凝胶微球是由纳米颗粒得到的多孔网络结构,孔隙率多达85%-95%,网状结构中填充有气态分散介质的固体材料。气凝胶凭借自身独特的结构,使其具备高比表面积、低导热性以及低密度等优势,进而在催化科学以及声学等相关领域内获得普遍地运用。本文选择正硅酸乙酯作为前驱体,选择乙醇作为溶剂,通过乳液成球技术以及溶胶-凝胶过程的有效控制,制备得到Si O_2水凝胶微球,然后经由常压干燥法的方式实现气凝