【摘 要】
:
随着数据时代的到来,数据间的交互越发频繁,数据在传递过程中的隐私泄露问题日趋严重。因此,如何保证数据在交互共享的过程中隐私信息能得到有效的保护成为专家学者研究的热
论文部分内容阅读
随着数据时代的到来,数据间的交互越发频繁,数据在传递过程中的隐私泄露问题日趋严重。因此,如何保证数据在交互共享的过程中隐私信息能得到有效的保护成为专家学者研究的热点。k-匿名(k-anonymity)技术则是一种有效的隐私保护方法,其核心思想是通过对数据表中的元组进行匿名处理,使得处理后的数据表中的每一个元组都至少存在k-1条除敏感信息外与其不可区分的元组,从而保证攻击者无法准确推断出隐私信息所属的个体。k-匿名技术的求解算法众多,微聚集算法MDAV(Maximum Distance to Average Vector)即是其中较常使用的一种。其核心原理是依据元组间的相近程度进行快速分类,利用类质心进行匿名处理。该算法在效率、数据的可用性和安全性等方面均能取得较好的效果。本文主要针对隐私保护中的k匿名模型及其求解算法MDAV进行研究,分别从准标识属性和敏感属性这两个维度出发,有针对地进行个性化隐私保护。算法与模型的改进研究具体内容如下。(1)针对k-匿名求解算法MDAV,着重考虑准标识属性的重要程度,提出了灰微聚集算法GMDAV(Grey Maximum Distance to Average Vector)。该算法通过灰关联分析对属性的重要程度进行度量,在划分等价类时着重考虑重要属性的接近程度,以此加强重要属性的信息保有度。实验证明,通过该算法求解k-匿名模型能够有效地减少重要属性的信息损失程度。(2)在现有匿名模型的基础之上,着重考虑了敏感属性值的分布,提出了(k,l,gp)-匿名模型。该模型采用分位点结合敏感值出现频率,对等价类和全局的敏感属性值分布情况进行描述,要求二者的均衡接近度大于阀值gp(p为设置的参数)。并且,该模型增加了扩充等价类时新增元组的条件约束,要求新增元组能改善均衡接近度。通过实验验证,该模型能在保证信息较少损失的同时,减少隐私泄露风险。(3)对(k,l,gp)-匿名模型进一步改进,着重考虑了敏感属性值的敏感程度,提出了(k,l,gp,a)-匿名模型。该模型将敏感度a引入(k,l,gp)-匿名模型,并与灰关联分析结合,使得等价类与全局的敏感值分布关联度能够体现敏感值的敏感程度个性化,实现差异化隐私保护。通过实验验证,该模型不仅实现了面向敏感值的个性化隐私保护,有效保证了高敏感度敏感值的安全性,并有较好的隐私保护综合能力。
其他文献
行人检测的应用领域很广泛比如智能交通、智能汽车辅助驾驶系统、智能监控、无人机检测等。由于道路环境中的行人存在遮挡、光照变化、多种姿态、复杂背景等问题,所以在道路
绩效考核是一个公司人力资源部门的重要任务,它需要选取一定的标准,根据员工工作的具体情况,采用科学有效的考核与评判方法对员工通的工作成绩进行评价。这项工作在当今市场
倒装芯片铜柱凸点互连是一种先进的集成电路(IC)封装技术,适用于覆晶封装上硅芯片与基板的连接。因具有细节距、微尺寸、超高I/O密度等优点,而广泛应用于军事、医疗、移动通
延迟容忍网络(DTN,Delay Tolerant Network)是一种不同于传统无线网络的新型网络模型。DTN中不存在稳定的、持续的端到端连接,所以通过采取“携带-存储-转发”的路由机制完成
LED因具有发光效率高、寿命长、体积小、环保等优势而在各个照明领域得到广泛应用。目前单颗LED功率仍较小,通常需要将多通道LED串并联连接使用以获得较高的亮度。但由于LED
随着国家对于国民健康投入的不断加大,外资药企的不断涌入,新药上市步伐的不断加快,无一不在考验着临床医生的学习速度。S公司拥有全球最大的医生社交网络平台,为了活用全球医生资源,打造更紧密的医生社区,帮助医生对于新药的快速学习,但是由于语言等障碍一直未在亚洲取得很好的效果。S公司2017年在欧美率先发布全球首款药物评分系统,由全球会员医生直接为药品评分,从五个方面对特定药物的有效性、安全性、耐受性、可
烤烟的质量受品种、生态和栽培措施的综合影响,在一定的品种和栽培条件下,生态条件中的气候因子对烤烟上六片质量的形成和浓香型风格的彰显起着关键性作用。豫中烟区开展上六片生产和利用已有数年,但由于在气候因素等方面缺乏系统研究,上六片烟叶存在成熟度偏低、香气欠佳、在高档品牌中适配率低等问题。因此,在系统开展优质上六片烟叶生产关键技术的基础上,建立相应的标准化气候指标体系,充分挖掘上六片生产质量潜力十分必要
本文以苦水玫瑰精油为主要材料,通过化学成分分析、动物行为学试验比较其和大马士革玫瑰精油的镇静催眠功效,并通过神经化学试验研究苦水玫瑰精油镇静催眠功效的作用机制,得
在对治愈率的分析中,往往存在由于某些原因而致使观测时间删失的情况。对于这种情况,无法判断个体是否被治愈,即个体的治愈情况是缺失数据,因而也无法对这部分数据进行治愈率分析。针对这种数据删失的情况,使用一种多重填补的方法,用带有删失数据的生存数据去进行治愈率分位数回归,估计治愈率分位数回归模型中的参数。首先,使用一种迭代的算法去估计每个个体的条件未治愈概率,然后使用这一估计概率去估计个体的治愈情况,即