基于差分隐私的回归分析算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:aacpc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,海量数据的分析和发布等应用引发了研究热潮,回归分析的实际应用也越来越广泛,目前面临的重要挑战是如何保护回归模型参数的隐私数据,防止攻击者根据模型参数推断出敏感信息,造成敏感信息泄露。差分隐私作为一种新出现的隐私模型,不仅可以防止任意背景知识的攻击,也可以在保护数据隐私的同时避免数据失真。针对直接发布回归模型的模型参数,会导致数据集中的数据信息泄露问题,本文着重把差分隐私应用于线性回归模型和逻辑回归模型的分析。研究“基于差分隐私的回归分析算法”,包括以下三个内容:1.阐述了传统的隐私模型:k-anonymity、l-diversity。通过举例说明这两种模型特点及缺陷,引出?-差分隐私保护,并对差分隐私的噪声机制、组合特性、保护框架和评价指标进行了相关探讨。2.在研究线性回归模型的差分隐私保护时,通常都存在加噪后的线性回归模型敏感性偏大和噪声偏大,造成线性回归模型预测精度偏低问题。针对这个问题,本文提出了一种差异化的隐私预算分配算法Diff_LR,该算法首先把目标函数分解成两个子函数,再分别计算两个子函数的敏感性、分配合理的隐私预算,并采用拉普拉斯机制给两个子函数系数添加噪音,然后对子函数进行组合,得到添加噪声后的目标函数,再求取最优线性回归模型参数。理论证明Diff_LR满足?-差分隐私,通过实验分析也可得出结论:相对于其他隐私保护算法,Diff-LR不仅降低了敏感性,减少噪音添加,也使线性回归模型有更高的预测精度。3.在研究逻辑回归模型的差分隐私保护时,针对预测精度偏低问题,本文提出了一种Diff_Gene算法。该算法结合遗传算法原理,首先对若干候选参数的每一次迭代分配合理的、差异化的隐私预算,然后利用指数机制挑选top-k个较优参数,比较这k个参数被输出的概率,选择被输出概率最大的候选参数,通过不断迭代,求出最优逻辑回归模型参数。实验分析结果证明,Diff_Gene算法在模型预测精度方面比其他隐私保护算法具有更好的效果。综上所述,本文的主要贡献在于对线性回归模型和逻辑回归模型的差分隐私保护进行研究,提出新算法。新算法在保护隐私的同时,提高了回归模型的预测精度。
其他文献
目的:探讨留置导尿管患者拔除导尿管后尿潴留发生率最低的最佳拔管方式。方法:将60例长期留置尿管患者随机分为试验组和对照组各30例,拔尿管时,对照组排空膀胱后拔除尿管,试
燃煤导致的汞污染已受到广泛的关注,由于单质汞的理化性质,决定了对汞污染控制技术主要集中在如何控制单质汞方面。我国863计划也将燃煤汞排放控制技术的开发,作为其中一项重
<正> 臂搁,又名“秘搁”,多以竹木、象牙,玉石、珐琅、陶瓷等材料制成,形制大多为仿竹节的形式。特别是在清代,臂搁的使用尤为突出,是文人写字、作画时承腕垫肘的文房用具,亦
刑事审级制度是刑事审判制度中的一项重要内容,是指审判机关在纵向组织体系上的层级划分,以及刑事案件最多经过几级法院审理之后,其裁判才发生法律效力的一种法律制度。根据
目的探讨关键指标法在骨科科室护理绩效考核中的应用及效果。方法确定护理质量、护理工作量、岗位系数、年资系数、专业素质为关键指标,并赋予不同权重,结合临床护理工作进行
科技投入是杭州市实施“科技兴市”战略的基本保证 ,近几年杭州市的科技投入量在逐年增大 ,但也存在一些问题 ,科技投入仍然不足 ,难以满足杭州市科技事业进一步发展的需要。
吉纳斯特拉是二十世纪阿根廷乃至拉丁美洲最为著名的音乐家、作曲家。他的一生创作了大量极富阿根廷民族色彩的音乐作品,成为将阿根廷民族音乐推向世界舞台的先驱者,同时也为
本文介绍了模块化高温气冷堆的安全特点,对反应堆堆芯设计核安全审评重点关注的核安全问题进行了分析,并提出解决方案以供设计和审评人员参考。
从分析我国口腔医学的美学教育起源和现状入手,结合口腔专业的特点和美学教育的功能,阐述了美学教育在口腔医学专业教育领域的必要性及开展口腔医学专业美学教育的方法。
江泽民总书记在"5&#183;31"重要讲话中,第一次明确地提出了"建设社会主义政治文明"的科学论断,具有十分重要的指导意义.如果说社会主义民主政治的核心,是党和政府"执政为民",
期刊