【摘 要】
:
当今,随着数据发布和数据挖掘技术在数据库方面的应用越来越广泛,敏感信息泄露已经成为威胁信息技术发展的一个重大问题。对敏感信息的隐私保护已经成为数据安全和数据挖掘应
论文部分内容阅读
当今,随着数据发布和数据挖掘技术在数据库方面的应用越来越广泛,敏感信息泄露已经成为威胁信息技术发展的一个重大问题。对敏感信息的隐私保护已经成为数据安全和数据挖掘应用方面的一个重要研究方向。K-匿名是在数据发布中应用较为广泛的隐私保护方法。本文基于K-匿名技术对工程建筑系统中的数据发布中的敏感信息泄露问题进行分析和研究,对原有的匿名模型进行了优化。本文针对现有的K-匿名用于数据发布中存在的保护问题,即没有充分地考虑敏感属性的问题,提出了基于K-匿名的两次聚类泛化隐私保护模型。该模型从敏感属性是数值型数据这一特殊点着手,对敏感属性数值按照数值差额归属到不同的敏感度级别,然后从数值的分布和等价类中敏感属性不能都相似这两个方面分别进行聚类泛化。同时,本文对其他的匿名算法进行研究分析,结合聚类和两度匿名的算法思想实现了基于K-匿名的两次聚类泛化算法,且每次聚类泛化中要求数据记录尽可能在准标识符上相似,并结合泛化给出与距离和信息缺损相关的公式以及定义。本文利用工程建筑系统中的模拟数据在算法的执行时间和信息缺损上来验证改进的基于K-匿名的两次聚类泛化算法。另外,利用Adult数据集对本文提出的算法和P-Sensitive K-匿名算法在执行时间和信息缺损上进行对比分析。由实验结果分析可得,本文提出的两次聚类泛化算法不仅能较好地保护敏感信息,还能保证数据的潜在可利用价值和统计性。
其他文献
政治课的体验性教学是学生深化认识和获得情感的重要途径,也是政治教学理论联系实际的主要形式。但由于认识的缺乏和条件的限制,政治课的体验性教学和学习还流于形式。政治课
目的:探讨抑癌基因PTEN蛋白在骨肉瘤中的表达及意义,分析PTEN在不同组织学分级的骨肉瘤中的表达水平,确定PTEN蛋白可否作为骨肉瘤的诊断标志物,以及将PTEN表达的异常程度作为指导
以甲苯二异氰酸酯(TDI)、二羟甲基丙酸(DMPA)、聚醚(N-210)为预聚体单体,以N′N-双(2-羟甲基)氨基乙基膦酸二甲酯(Fyrol-6)和含磷多元醇OP550作为硬、软段阻燃扩链剂,合成了硬、软段共
本文观察了60例17~56岁的男性十二指肠溃疡病人,患者均于溃疡急性发作期住院。诊断根据为临床表现与胃和十二指肠粘膜的内窥镜所见。研究了胃分泌机能及胃液的蛋白水解活性。
随着第五代移动通信系统(5th Generation of Mobile Communication System,5G)的发展,一些大数据量业务的流行,如虚拟现实、怕无人驾驶、超高清视频流等,对通信系统的整体性能提出了更高的要求。毫米波和大规模天线技术(Massive Multiple-Input Multiple-Output,Massive MIMO)作为5G关键技术,二者的结合能够有效提升
2013年8月~2014年1月,福建博物院文物考古研究所和福州市考古队联合对福州地铁屏山遗址(地铁一号线屏山车站主体)进行考古发掘,发现了西汉及以后的多时期遗存,本文主要对该遗
为了分析不同灌溉方式的节水效果和对植物生长发育的影响,通过对大棚西红柿进行沟灌、滴灌和地下灌溉3种灌溉方式的试验,分析不同灌溉方式、灌水量、注射深度对大棚西红柿茎
五年多来,内蒙古电力多边交易市场作为我国直购电试点区域之一,稳步推进,成效显著。2015年前8个月完成多边交易电量316.53亿千瓦时、同比增长39.36%,多边交易电量占蒙西电网
目的观察我院3年来翼状胬肉切除伴自体角膜缘干细胞移植术复发率及临床疗效。方法随访观察我院2016年01月01日至2018年12月31日眼科住院手术的翼状胬肉患者110例(140只患眼),
为深入认识中国流动人口在城市内不同地带就业、生活的分布状态与分布差异,选择北京为例,着重社会学角度,分析研究了流动人口在北京中心区、近郊区、远郊区三个地带的分布差