Spark框架下保护数据差分隐私的遗传聚类算法

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:xiaozi134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对分布式计算框架下海量数据聚类分析过程中的数据隐私泄露问题,提出了一种Spark下支持差分隐私保护的遗传k-means聚类算法。首先利用遗传算法实现对k-means聚类方案的全局寻优,提高算法的准确率;并采用种群迁移策略将遗传k-means算法部署于Spark框架中,实现基于内存读写的分布式聚类;然后利用差分隐私保护的Laplace机制在Spark每轮迭代的mapvalues算子中,对各聚簇中记录数量num和聚簇中各记录之和sum上添加随机噪声。根据差分隐私保护的性质,通过理论分析证明了算法达到ε-差分
其他文献
针对不同的土壤盐渍化程度,采用理论计算与实测验证相结合的方法,开展了南疆盐渍化土壤排盐系数及淋洗定额的确定。结果表明,南疆地区不同盐渍化程度土壤的排盐系数不同,土壤
目的探讨小儿缺铁性贫血的原因提高治疗效果。方法对通榆县第一医院儿科2003年8月至2010年5月102例缺铁性贫血病儿进行原因分析并进行铁剂治疗和去因治疗。结果 102例患者中,
与其他国家的农业发展情况相比较,我国则较为复杂与特殊,在农业发展的进程当中,取得骄人成绩的同时,也表现出了一定程度上的不足,我们应以正确的态度应对这些问题与不足。文
目的探讨神经内科患者应用综合护理干预措施在临床康复护理中的实施效果。方法选取我院神经内科2018年1月~2018年12月收治住院的患者180名作为此次研究的对象,按照信封双盲分
在浅海域,舰船航行时会产生海底地震波,其中,Scholte波沿海水和海底交界处的流-固界面传播。本文分析了Scholte波的特性和质点运动轨迹的极化特性,提出匹配追踪算法和时-频分
基于建构主义的“五步教学法”在职高电工学教学中应用,要切实把握好问题导入、实验探究、归纳总结、知识填充和知识应用这五个环节。 Based on the constructivism “five-
介绍了三相交流调压的原理与应用 ,根据三相交流电彼此相位相差 1 2 0°的原理 ,提出了一种新的三相交流调压方案 ,同时对其主要电路的设计及工作原理也作了介绍
本文基于Java的Weblogic具有很好的鲁棒性,能够通过编程实现节点的轮询,结合Kafka的流处理能力,在发现节点告警信息之后快速的进行现场快照以及节点恢复工作,使得宕机节点得
中学生正处于向成人的过渡期.也是各种危险行为形成的关键期.对成人的世界表现出强烈的好奇心.易受各种危险行为因素的影响。为了解余姚市中学生各种行为危险因素.建立切实可行、
目的探讨实施激励护理对神经内科患者康复效果的影响情况。方法对照组在康复治疗期间仅给予常规护理服务,研究组在康复治疗期间行常规护理基础上加用激励护理措施。结果护理