隐私保护的数据挖掘研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:wjh901223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,数据挖掘技术在一些深层次的应用中发挥了积极的作用。与此同时,也带来隐私保护方面的问题。如何在数据挖掘过程中解决好隐私保护问题,成为数据挖掘领域的一个研究热点。在数据挖掘中,通常隐私被划分为两类:一类隐私是原始数据本身所具有的,另一类隐私是原始数据所蕴含的知识。本文通过对第二类隐私问题从两个方面进行的研究,提出了相对应的隐私保护的数据挖掘算法。  针对在水平分布数据环境下使用传统k-最近邻分类算法不仅需要高速的数据通信网络,还可能会使数据的私有性和安全性遭受威胁。本文从隐私保护的角度出发,对k-最近邻分类算法进行了深入的研究,提出了基于安全多方计算(SMC)的水平分布数据环境下的有效分类算法KNNDE。理论分析和实验证明了该算法在达到与传统集中式k-最近邻分类算法相近精度的同时,保持了参与协作挖掘各方的数据隐私性。  针对关联规则挖掘过程中的隐私保护问题,提出了一种采用减小敏感项集支持度或置信度的算法,对敏感关联规则进行隐藏。隐藏算法的目标是在关联规则挖掘的隐私保护和减少对原始数据集影响之间取得平衡。本文使用IBM人工数据集生成器,随机生成用于验证算法有效性的实验数据。理论分析和实验均表明,该隐私保护的关联规则挖掘算法具有很好的有效性、正确性。
其他文献
随着人类基因组计划的开展与现代生物技术的迅猛发展,生物信息数据的增长呈现爆炸之势,这为揭开生命奥秘提供了数据基础;计算机运算能力的提高和国际互联网络的发展使得对大规
随着移动互联网时代的全面来临,智能手机与平板电脑日趋大众化,移动智能终端已经成为接入移动互联网的最佳入口。互联网、电信网和广电网内容不断相互渗透,逐步形成三网内容业务
移动机器人可以代替人到各种艰苦、危险的野外环境中执行任务,而野外环境具有复杂性、多变性、随机性等特点,为了保证机器人安全、有效的完成任务需要保证地形分类的实时性和适
神经网络集成是目前机器学习的热门研究方向之一,在许多领域有着广泛的应用,如数据挖掘、模式识别、文本分类、预测等方面。神经网络集成通过训练多个神经网络并将其结果进行
在DNA序列中,模体(Motif)就是指DNA序列中保守的序列片段,而从DNA序列中发现这些模体的过程就是模体发现(Motif Discovery),模体对DNA的转录翻译起着重要作用,因此模体的关联
本文在对太阳能电池板工厂自动化解决方案(FAS)结构和功能分析的基础上研究物流传送系统(MHS)的功能,并设计和实现了MHS系统模拟器(MHSSimulator)。本文首先介绍FAS的结构和
USB接口大幅面彩色扫描仪在军用、测绘、印刷等领域发挥着越来越重要的作用,而其通信接口的性能直接影响数据的传输速度,在扫描仪研制中占有重要地位。本文首先论述了USB接口
随着集群系统的发展,集群作业管理系统已成为高性能计算机领域的一个热点问题。本文结合Platform Computing公司开发的LSF集群作业管理系统,对该系统中的资源信息数据和作业
当前社会对个人身份的安全性的要求越来越高,使得生物特征识别技术在各种身份认证领域得到了广泛的应用,特别是高分辨率脱机掌纹识别技术。低质量的脱机掌纹图像会严重影响后续
医用机器人与计算机辅助外科手术技术冲破了传统开放式外科手术带来的局限性,减轻了患者的痛苦,改善了医生的工作环境,提高了手术的成功率与治愈率,倍受医生与病患的青睐。  本