差分隐私保护下一种精确挖掘top-k频繁模式方法

来源 :第30届中国数据库学术会议 | 被引量 : 0次 | 上传用户:hsjxln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集合有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(differentially private top-k pattern mining).该算法利用指数机制从候选频繁模式集合中挑选出top-k个携带真实支持度计数的模式;采用拉普拉斯机制产生的噪音扰动所选模式的真实支持度计数;为了增强输出模式的可用性,采用后置处理技术对topk个模式的噪音支持度计数进行求精处理.从理论角度证明了该算法满足ε-差分隐私,并符合(λ,δ)-useful要求.实验结果证明了DP-topkP算法具有较好的准确性、可用性和可扩展性.
其他文献
奥美沙坦是一类选择性血管紧张素Ⅱ 1型受体(angiotensin Ⅱ type 1 receptor,AT1)拮抗剂,在高血压治疗领域发挥重要作用[1]。其应用广泛,不良反应较少。目前未见奥美沙坦相
目的:分析新型冠状病毒肺炎(COVID-19)患者治疗前后的CT表现,为COVID-19的诊疗提供可靠的影像学依据。方法:本文回顾性分析了22例经病毒核酸检测阳性的COVID-19病例资料,对比
(1)光学应用纳米复合涂料。纳米粒子的粒径远小于可见光的波长400-750纳米、具有透过作用,从而保证了纳米复合涂料具有较高的透明性。纳米粒子对紫外线具有较强的吸收作用。在汽