关于差分隐私保护分类算法的研究

来源 :南京航空航天大学 | 被引量 : 4次 | 上传用户:redlong888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息交流共享日益频繁的今天,隐私安全问题越来越引起人们的重视。通常的数据挖掘算法只关注于有用信息的提取,而忽视了数据信息的隐私保护,因此差分隐私保护与数据挖掘算法的结合具有十分深刻的意义。本文主要进行了关于差分隐私保护分类算法的研究,特别针对不完全数据集,提出了特殊的缺失值处理方法。首先研究了差分隐私保护分类决策树算法。根据现有算法的缺陷与不足,提出了指数机制的随机森林决策树算法。并针对带差分隐私的ID3和随机森林决策树算法,基于不完全数据集,运用动态权重更新的思路提出了WP缺失值处理方法。实验表明,该方法能够在提供同等差分隐私保护的前提下,进一步提升算法的准确率,提高其实用性。然后研究了基于完全数据集的差分隐私保护Adaboost算法。在Adaboost分类算法弱分类器构造过程中,将预先分配好预算的差分隐私保护噪声加入到算法中,实现了DP-Adaboost算法。实验表明,完全数据集下的DP-Adaboost算法分类结果相对于带差分隐私的ID3和随机森林决策树算法有一定的进步。最后研究了DP-Adaboost算法的变形,使其适应于不完全数据集。针对不完全数据集,为每一个弱分类器增加了隐私权重指数,同时在加入差分隐私噪声的过程中,动态地改变了差分隐私敏感度,实现了差分隐私保护Adaboost缺失值处理算法。实验表明,该算法具有更好的分类准确性以及更强的数据适应性。
其他文献
基于种群的进化算法在一次运行中能够产生一组近似的Pareto最优解集,因此多目标进化算法成为处理多目标优化问题中的主流方法。基于分解的多目标进化算法(MOEA/D)将一个多目
随着移动互联网技术的发展,位置相邻用户之间的数据通信业务也在逐渐增多,所以,用户设备之间的直接通信(D2D)技术正在受到越来越多的关注。本文通过对移动蜂窝网中的D2D通信
DNA作为长期存储生物遗传信息的载体记录着具有极高研究价值的基因数据。而近几年,随着下一代测序(next-generation sequencing,NGS)技术的高速发展,海量的DNA数据不断的涌现
诺如病毒(Norovirus,NoV)是引起世界范围内急性胃肠炎的主要病原体之一,造成严重的公共卫生问题和经济负担。流行病学研究表明GⅡ.4是全球优势流行株,每隔1-3年便出现新的变异株,占到全部NoV感染的85%,而其他基因型NoV则以局部暴发和散发为主。由于NoV基因型别众多,对于NoV疫苗的研制是一个巨大的挑战。迄今为止,尚无针对NoV的特效药物和疫苗。为了研制广谱NoV疫苗,Parra等人
拥有多层基站部署的异构网络被认为是第五代移动通信系统(the fifth generation mobile networks,5G)的核心技术之一。与传统同构网络相比,异构网络能够填补基站覆盖漏洞,有
蛋白质磷酸化是广泛存在的翻译后修饰之一,几乎涉及细胞内所有的生物过程,例如细胞代谢、细胞生长、细胞分化以及信号传导等。磷酸化修饰是指在激酶的催化作用下,将磷酸基团
目的:1.建立小鼠昼夜节律紊乱(circadian rhythm disorder,CRD)模型。2.探究昼夜节律紊乱及丁酸盐干预后对小鼠认知功能的影响。3.探究昼夜节律紊乱小鼠及丁酸盐干预后海马神经元组织形态学变化。4.探究昼夜节律紊乱小鼠及丁酸盐干预后脾脏辅助性T细胞17(T helper cell 17,Th17)及调节性T细胞(regulatory T cells,Treg)分泌的白细胞介
目前,对于稀土金属膦宾配合物的研究仅限于桥联型且并不系统,末端型稀土金属膦宾尚未被成功稳定并分离。探索稀土金属膦宾的合成及反应化学对于扩充稀土配合物系统,深入理解
不完全信息的研究与处理是数据库领域研究的热点之一。现有的大部分商业数据库建立在传统关系数据模型的基础上,对涉及空值的查询处理缺乏形式化定义和统一的理论支撑。这些
自电离光谱可以提供自电离总截面的信息,而自电离衰变的分支比和弹射电子的角分布则分别对应于自电离的部分截面和微分截面,它们比自电离光谱能够提供更多的原子信息,如:原子