静态数据脱敏系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xujinchang5280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
继第三次工业革命以来,互联网技术以惊人之势迅猛发展,信息化技术越来越发达。众多组织机构或者个人保存了大量公民个人各种各样的数据信息。如何保证这些数据的不被泄露,避免个人隐私数据落入不法之徒的手中已经成为数据安全领域的一项重要研究问题。现有的保护个人隐私敏感数据的方式方法易造成丢失原数据的实际意义,且支持处理的数据类型单一。另一方面,系统脱敏结果不可逆,并且在处理大量数据时,耗时较长。因此本论文设计并实现了一种新的静态数据脱敏系统,实现该系统主要是分成为四个步骤。第一步,基础工作环境信息的配置以及相应的源数据库,目标数据库的连接,确定数据脱敏的模式;第二步,读取数据库中待处理的个人隐私敏感数据,识别出该个人隐私敏感数据的类型,对识别结果进行梳理,并统计出相应类型的个人隐私敏感数据占总体数据量的比例;第三步,将个人隐私敏感数据根据已知的配置信息进行脱敏处理,然后将结果写入目标数据库;第四步,将脱敏前后的敏感数据进行对比,方便用户验证脱敏结果的有效性。因此,本论文主要进行以下工作:(1)编写个人隐私敏感数据类型扫描器。个人隐私敏感数据类型扫描器的功能主要是实现从源数据库中读取数据并写入到一个中间文件中,然后根据各个类型的个人隐私敏感数据的编码特征,以及应用调整个别敏感类型识别的优先级等策略,实现准确识别各个类型的个人隐私敏感数据的类型。(2)分析系统所支持处理的三十余种类型敏感数据的编码规则,并根据各个类型敏感数据的编码特点,分别编写对应的随机脱敏,正向脱敏,逆向脱敏和遮蔽脱敏四种脱敏模式下的脱敏算法。本文实现的系统的创新点在于识别未知类型敏感数据时,正确率达到96%,减少人工梳理操作,且具有支持处理的个人隐私敏感数据的类型种类多的特点。可以根据用户应用的具体场景需求实现支持处理的敏感数据类型的增删,并且随机脱敏、正向脱敏和逆向脱敏模式下的脱敏结果保持数据的原有实际意义,正向脱敏与逆向脱敏相结合实现了脱敏结果的可逆。相比现有的数据脱敏系统在处理T级别的数据量上,具有时间短,效率高的优势。
其他文献
研究目的:本研究以扬州鉴真国际半程马拉松赛事为例,基于赛事参与者满意度,探讨政府建设赛事品牌的责任。通过对扬州政府人员的访谈以及赛事参与者的满意度调查,探究扬州政府在赛事品牌发展期和成熟期两个阶段落实的责任,为改善当前马拉松赛事同质化现象,促进马拉松市场良性发展提供理论参考,为其他城市赛事举办地政府更好地建设马拉松赛事品牌提供借鉴作用。研究方法:本研究以访谈法、问卷调查法及数理统计法为主要研究方法
随着第五代移动通信(5G)的标准化和部署如火如荼的推进,终端设备的数量激增并产生大量的业务需求,对网络带来挑战。设备到设备(D2D,Device-to-Device)直连通信是解决该挑战、提高无线频谱利用率的关键技术之一,并可通过中继方式扩大其通信范围。然而传统的D2D通信中,终端将在链路上一直盲检,导致在没有数据交互的时候产生不必要的能耗。因此有必要探索可应用于D2D通信网络的节能通信技术,提高
设G是一个有限群,T是群G的不包含单位元1的生成子集.如果右乘变换群R(G)在全自同构群Aut(X)=Aut(Cay(G,T))中是正规的,则我们称群G关于其子集T的Cayley图 X=Cay(G,T)是正规的.令G=<a,b,c|ap=bp=c4=[a,b]=1,ac=b,bc=a>,p为素数,且p>3.在本文中,我们确定了一类4p2阶群G的4度Cayley图的正规性,并证明了
本文以储层特征、含气性地层测试特征、资源量及采收率为核心研究内容,通过储层的精细刻画、压裂及排采过程中地层流体反应捕捉和资源量采收率估算,综合评价穆棱拗陷煤层气资源的可采潜力。通过对穆棱拗陷煤层发育特征、含气性特征、煤质及变质程度、储层物性、储层压力、水文地质条件等储层特征研究分析,穆棱拗陷煤层气开发潜力较大的层段主要集中于城子河组中下段,该段煤层发育稳定、煤厚大、埋深适中、煤层分布集中,14煤厚
钢铁行业产业链长、工序复杂,资源消耗量大,一直是我国大气污染治理的重点行业之一,而烧结工序又是钢铁行业的污染大户,传统的烧结工艺具有高能耗、高污染、余热利用率低等特点。烧结烟气循环技术是将部分烧结烟气通过烟气密封罩返回至烧结机台车上方再次参与烧结的一种方法,具有良好的节能减排效果。在工业实际烧结烟气循环系统运行过程中,普遍存在烟气分配不均以及烟气密封罩内料面气流分布不均等问题。本文以某钢铁厂360
那西郭勒石墨矿位于西域板块(Ⅰ)、东昆仑陆块(Ⅰ7)、东昆仑岩浆弧带,地处伯喀里克-香日德印支期金、铅、锌(铜、稀有、稀土)NW-NWW向成矿带(Ⅲ12)西端。矿区共圈定石墨矿带4条,石墨矿体34条。矿体呈北西向产出于古元古代金水口岩群斜长角闪岩组石英岩和大理岩组的大理岩中,受金水口岩群特定地层岩性、北西向背斜构造及早三叠世花岗闪长岩综合控制。综合研究认为,那西郭勒地区的石墨及铁矿成矿经历了古元古
我国从1970年代开始实行家庭联产承包责任制,在当时极大激发了农民劳动的积极性,为推动我国农村农业发展做出了突出贡献,在特定历史条件下发挥了重要作用。近年来,随着我国科
十七大之后,党中央推出了“大学生村官计划”这一重要战略决策,期望通过该计划为社会主义新农村建设培养骨干人才,为党政干部队伍增添后备人才,为各个行业培养精英人才。目前
随着数字化的发展,如何安全的识别个人身份已经成为社会关注的热点。生物特征识别以自身所具有的便携性、唯一性渐渐走入人们的生活。一些传统的如指纹、声音、人脸、虹膜等生物特征开始在社会各领域中广泛适用。然而上述特征存在容易被窃取、被伪造等缺陷,难以满足日益提高的安全性需求。脑电作为一种新型的生物特征,既有传统生物特征的特点,又具有活体检测、抗伪造、高隐蔽性等优势。上世纪末,研究者就开始将脑电应用于身份识
当前,我国非金融企业杠杆率不断上升,而在非金融企业部门中,国有企业杠杆率较高,急需采取措施降杠杆。为促进我国经济平稳运行,降低企业杠杆率,国家大力推行“三去一降一补”,并将债转股作为降杠杆的重要举措推行。在此背景下,中国中铁积极响应国家号召,于2018年6月开始策划实施债转股,中国长城牵头联合另外8家投资机构参与,通过对四家子公司债转股来降低债务压力,成为首家实施债转股的建筑央企。本文以中国中铁为