满足差分隐私的频繁子图挖掘算法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:otherwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据挖掘技术已经成为研究人员从数据中提取有用知识的重要工具。频繁模式挖掘是数据挖掘领域中的一个重要课题,用于得到事物之间的关联特性。频繁子图挖掘是频繁模式挖掘的一种具体形式,它从图数据集合中获得频繁子图结构,在图数据的分析中具有重要的意义。然而,如果这些子图中涉及敏感信息,直接发布或分享这些频繁子图就有可能造成个体用户信息的泄露。为了解决上述问题,本文提出了一种满足差分隐私的频繁子图挖掘算法DFG (Differential Private Frequent sub Graph mining algorithm)。DFG使用了一种两阶段算法的模型。第一阶段为频繁子图选择阶段,DFG算法在这一阶段中按照逐渐增大子图边数的方式挖掘频繁子图,并使用了二分估值算法和条件指数机制降低挖掘过程中所引入的噪音量;第二阶段为噪音支持度计算阶段,DFG算法在这一阶段中对频繁子图建立网格结构,并利用基于噪音量反馈的多路径建立算法得到覆盖网格的路径集合,最后通过计数累加算法和噪音合成规则得到每条路径中频繁子图的噪音支持度。理论分析表明DFG算法满足ε-差分隐私保护;后续的对比实验结果表明DFG算法的数据效用和运行效率均优于现有的满足差分隐私的频繁子图挖掘算法。本文还说明了 DFG算法可以被扩展到频繁模式挖掘中,并根据频繁项集挖掘的特点对网格结构进行优化,提出了 DFISL(Differential Frequent Itemset mining algorithm based on Sub Lattice)算法。实验分析表明DFISL算法的数据效用比现有的PFP-growth算法和DiffFPM算法更高。
其他文献
随着风电机组功率的增大,主轴组件与齿轮箱自重增加导致装配愈来愈困难。介绍了一种具有缷荷机构及6自由度调整的主轴组件与齿轮箱对中装置,采用双表对中测量法,推导出对中量
土地也能存进银行,除了有利息拿,还能像活期存折一样存取自由?近日,这样的“稀奇事”在四川省彭州市成为现实。“5·12”地震中,彭州受灾严重。在灾后住房重建中选择统规自建
0~6岁是人大脑结构和身体机能发展最为旺盛的时期,而这个时期也是人的个性、习惯形成的关键期。曾经听一位成功人士说过这样的一句话:“习惯决定命运”。是的,这句话也并不是没有
化学是一门以实验为基础的学科。“实验教学是化学教学的重要组成部分,是一种探究过程”。各种类型的化学实验。给学生提供了丰富的感性材料,使学生经过自己的探究形成理性知识
我国目前农村初中有着较好的德育教育,但是仍然有些不足之处.例如现实生活与德育脱节严重;学校德育比例过大,方法呆板单一;德育忽视学生主体性。理论化过多。本文提出通过教育改革
近些年来,浙江省乐清市农民专业合作社发展十分迅猛,截至2007年底,乐清市登记在册的农民专业合作社170多家,注册资金3400多万元,入社社员近1万人,带动农户42000户。然而,这些专业合
东营市广饶县南部井灌区由于超量开采地下水,形成超采漏斗,北部咸水发生反向运动,造成咸淡水分界线南移。咸水入侵最直接的后果是破坏了宝贵的淡水资源,导致区域地下水质变咸
2009年3月,中共中央、国务院颁布了《关于深化医药卫生体制改革的意见》(中发[2009]6号),这次新医改将公立医院改革确定为五项重点改革内容之一,着力改革公立医院补偿机制与
本期案例:内蒙古兴安盟农合农业有限责任公司成立时间:2008年3月推荐理由:兴安盟农合农业有限责任公司用实践告诉我们:农民专业合作社采取以土地折股入股、实现合作经营的形式。
随着计算机应用的普及,计算机教育已经得到越来越多的关注和重视。一般的应用操作、文字处理,已经是一种基本技能。这种技能的掌握是建立在大量实际操作基础之上的,是一种强调实