基于聚类的敏感属性保护方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:remine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,数据的电子化程度越来越高,数据的应用范围变得越来越广。数据发布作为信息共享的一种手段,在为数据交换和数据共享提供便利的同时,数据发布过程中的敏感信息泄漏问题也日益突出,对个人隐私带来了威胁。如果个人隐私信息被共享,将会给相关人带来很大危害,因此,必须对数据中涉及隐私的信息进行保护,对数据中涉及隐私信息的敏感属性进行约束,使最后发布的数据不会泄露隐私信息。所以如何保护隐私和防止敏感属性泄露就变成了数据应用方面的研究热点。   本文介绍了数据匿名和聚类的基础知识,分析概括了聚类方法在敏感属性匿名保护方面的研究现状,在此基础上,针对l-多样性匿名原则,提出了一种基于聚类的敏感属性保护方法,该方法所产生的信息损失较少,具有较高的数据可用性。为了进一步提高算法的运行效率,采用k-prototypes聚类算法对敏感属性实现匿名保护,针对k-prototypes聚类算法因随机选择初始点而导致聚类结果不准确等问题,提出了一种初始点选择方法,并将之用于基于k-prototypes的敏感属性保护方法中,取得了较好的效果。   论文的主要研究工作包括以下四个方面:   1、总结了数据匿名及聚类在隐私保护中的研究现状,介绍了聚类和数据匿名化方面的相关理论知识及技术。   2、针对k-prototypes聚类中因随机选择初始点而产生的问题,提出了一种初始点选择方法,并将该方法应用于k-prototypes聚类算法中。实验结果表明该方法可以获得较高的聚类结果准确率。   3、针对敏感属性的匿名保护问题,提出的一种满足l-多样型模型的基于聚类的敏感属性保护方法LS-clustering。实验结果表明LS-clustering算法所产生的信息损失较少,具有较高的数据可用性。   4、为了进一步提高匿名保护方法的运行效率,提出了一种基于k-prototypes的敏感属性保护方法,该方法采用改进了的k-prototypes聚类算法。实验表明该方法具有较好的运行效率。
其他文献
随着大数据时代的到来,商业银行在经营管理过程中面临着新的机遇和挑战.大数据时代背景下,商业银行在风险管理中,只有有效应用大数据手段,并发挥大数据技术的作用,才能有效化
成本管理在企业管理中占有较为重要的位置,成本管理的目的是实现有效的资源分配,避免企业资源的浪费,从而提高企业的管理效率.随着市场竞争的持续激烈,成本管理的作用也越来
目前全球经济复杂多变,国有矿山企业的生产经营环境也存在许多不确定因素和风险,因此国有矿山进行全面风险管理是非常有必要的.本文简述了全面风险管理的必要性,从完善全面风
随着社会经济的飞速发展,企业越来越重视财务管理,财务预算能够帮助企业了解其在经营发展过程中出现的问题,及时制定风险应对措施,提高企业的市场竞争力.基于此,本文从企业预
会计信息系统的出现使得企业会计数据处理形式发生了一定的变化,随着会计信息技术的普及,企业财务人员的工作方式出现了革命性的改变,大量的线下工作转移到了线上,工作强度也
在项目实施过程中,科学合理的成本管理方法可以有效控制企业成本开支,增加利润.通过提升全过程成本管理意识,积极建立全过程成本管理文化,针对当前企业成本管理漏洞,制定行之
档案管理工作是当前推动药品安全防线建立的关键,它主要根据国务院相关食品监管机构体制进行改革,希望充分发挥药品检验档案在药品检验中的重要价值作用.本文中将主要探索药