基于差分隐私聚合的隐私保护推荐系统研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:shade89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着推荐系统的广泛应用,用户隐私也面临着泄露的风险,因为个性化推荐系统需要获取大量的个人基本信息,其中包含大量隐私数据。这些隐私数据一旦泄露,很有可能被犯罪分子利用,威胁用户安全。其次,由于用户担心自己隐私的泄露,在相关应用要获取自己的个人信息的时候,往往产生不信任感,进而拒绝相关服务,这也成为了推荐系统发展的一个障碍。因此,推荐系统中的用户隐私保护相关问题有着重要的研究价值。本文基于差分隐私基本思想,提出基于差分隐私聚合的隐私保护推荐系统。本文具体工作如下:本文提出一种基于隐私聚合的图嵌入模型,通过数据划分并学习若干子模型,然后进行子模型聚合,并在聚合过程中添加噪声数据,以保证聚合过程满足差分隐私的要求,实现在图嵌入学习中保护用户数据隐私。本文提出的基于隐私聚合的图嵌入算法可以和各种不同的图嵌入模型相结合,并且保证训练结果满足差分隐私的要求,扩展性更强。本研究使用电影评分数据集,首先,将用户评分数据进行随机分组,分成若干个不相交的子数据集,且保证与原数据集独立同分布,将每个子数据集生成一个图,进行图嵌入学习得到若干子模型。然后,根据每个子模型构造一个判别器,用来判断指定的用户和项目的偏好关系,使用投票机制对一组未标记偏好关系的数据集进行判断,并在统计票数过程中添加特定要求的噪声数据,得到带噪声关系标签的数据集。之后,使用该数据集进行图嵌入学习,得到满足隐私保护的图嵌入模型。最后,给定指定用户,计算用户与项目的相似度并排序,根据近邻思想,输出推荐列表,完成隐私保护推荐任务。本文使用推荐系统领域常用的公开数据集Movie Lens进行相关实验。在Movie Lens真实数据集上进行隐私保护推荐系统的搭建和算法实现,将用户对项目的评价分为正向和负向并构建测试集,用模型对测试集中正向和负向评分关系的区分能力来对模型进行评估,将本文提出的隐私保护算法与多种对比算法进行了实验。实验结果表明本文提出的算法在给定的隐私预算下,具有较好的性能表现,并且运行效率在可接受的范围之内。结合所有研究成果,本文设计并实现了基于差分隐私聚合的隐私保护推荐原型系统。该系统可以展示本研究的各项结果,能根据用户选择的算法与不同的参数的设置,显示各项参数对系统结果的影响。
其他文献
蜉蝣目昆虫,俗称蜉蝣,是一类原始的昆虫。蜉蝣目昆虫线粒体基因组中研究发现扁蜉科、小蜉科和四节蜉科都出现t RNA基因重排现象,扁蜉科3属5种出现两种不同的排列方式,即赞蜉属Paegniodes的桶形赞蜉Paegniodes cupulatus呈现22个t RNA结构,而高翔蜉属Epeorus和拟亚非蜉蝣属Parafronurus形成trn I-trn M-trn Qtrn M重排且两个trn M高
学位
酒吧与夜店等城市异质空间与青年群体的关联研究是需要关注的重要议题。基于对作为城市异质空间典型代表的夜店及青年群体的质性研究,对二者之间的内在关联逻辑进行了探讨。本文从性资本的视角出发,对以夜店为代表的城市异质空间中的青年群体行为进行分析。研究方法主要采用参与式观察和结构式访谈两种以及滚雪球的方式拓展夜店受访人群。研究指出,夜店等城市异质空间之所以被青年群体认同,本质是城市异质空间属性迎合了青春消费
学位
前列腺癌的诱因主要有遗传、环境、年龄和种族,其中遗传因素是主导因素。SPOP是前列腺癌中点突变频率最高的基因之一,可能在癌症形成早期就发生突变,其突变是前列腺癌发生发展的潜在驱使因子,同时SPOP突变与TMPRSS2-ERG基因重排两个遗传事件在前列腺癌病人中互斥,提示SPOP突变引发的前列腺癌可能具有独特的病理机制。SPOP是E3泛素连接酶接头蛋白,参与特异性底物的识别以及蛋白酶途径介导的蛋白降
学位
蓝莓属杜鹃花科(Ericaceae)越橘属(Vaccinium spp.)多年生灌木或小灌木,因其富含花青素等功能成分而备受关注,近年来南方省份蓝莓种植面积也发展迅猛。蓝莓根表面不被根毛,其营养吸收主要依赖与蓝莓共生的菌根真菌,但蓝莓与内生菌的共生机理及内生菌的开发利用仍缺乏系统研究。本研究通过分离纯化并筛选鉴定出具有促进蓝莓生长的内生菌根真菌;分析内生菌根真菌促进蓝莓生长发育的机理;内生菌回接后
学位
随着电子商务的快速发展和形式的演变,直播成为众多零售商选择的销售方式。CQ珠宝商作为其中的一员,在通过直播获得业绩大幅度增长的同时,库存压力也一直在攀升。本文对CQ珠宝商以及直播带货的行业背景进行分析,总结了该企业在库存管理方面的现状、存在的问题,并对形成问题的原因进行了剖析,得出该企业在库存管理的制度流程、管理方法,以及软件配套上等都存在优化改善的必要性。本文基于ABC分类法、经济订货批量法、生
学位
随着我国经济越来越融入世界经济的版图,各地区的产业集群正愈加有力地影响着中国经济的发展。产业集群的发展和壮大,可以最大程度上实现资源和生产要素的配置优化,提高企业产品竞争力,生产专业化程度。同时也是推动地区经济可持续发展的有效途径。张庄街道作为城郊板块,得益于良好的区位和交通,工业实力雄厚,长期以来都是盐都区工业重镇,而齿轮产业则是张庄工业的重要支柱之一。但近年来,随着土地资源供给减少等原因,张庄
学位
随着深度学习技术的发展,以及在自然语言处理领域的不断突破,基于深度学习的实体识别和关系抽取任务已经逐渐从由于具有标注成本高、误差率高、局限于特定领域等诸多缺点而导致实际应用价值低、落地成本高的窘境,发展到了可以在少样本、复杂关系、跨领域的应用上实现一定价值。传统的实体关系抽取任务方法主要有两大问题:(1)割裂实体识别与关系抽取两个任务之间的联系。即关系抽取任务是基于实体识别任务的结果,且关系抽取任
学位
诚信经营越来越成为全社会的共识,作为社会经济活动中最活跃的因素,企业诚信经营或者说企业信用问题受到全社会广泛关注,伴随着商事制度改革不断深入,对于过去长期以往的准入监管模式提出了新的要求。伴随着商事制度改革,传统监管暨“网格化”管理模式已无法适应市场主体激增的市场环境,而针对企业信用情况开展监管已经成为市场监管部门以及市场监管领域各有关部门的普遍共识。本文着眼于协同治理视角下的企业信用监管工作,重
学位
伴随着我国刚刚经历了经济高速发展的黄金时期,房地产和建筑业引导我国的经济发展作出了卓越贡献。但是传统的建造方式,不仅材料资源浪费极大,同时还存在劳动力短缺、多处安全隐患以及频发的安全事故。同时在环保问题上也是重要的污染源,不符合可持续发展战略。相比较之下,装配式建筑在提升建筑工程质量、节能减排和改善工人工作环境、缩短工期等方面有着显著的优势。从2016年开始,国内的一些大型项目在装配式建筑的结构方
学位
近年来,泄漏、火灾、爆炸等典型突发大气污染事故频发,事故种类多样,严重破坏生态环境、威胁人类生命财产安全。准确预测局地尺度关键气象要素变化趋势、识别未知事故源参数(排放量、位置)、判断典型突发事故发展变化特征(事故发展、污染排放/扩散规律)以及开展污染预测及风险评估是解决上述问题、实现突发事故快速应急预警和科学决策处置的重要内容。准确预报局地尺度的风速、风向等气象要素是准确预报污染物扩散途径的基础
学位