基于隐私保护聚类的个性化推荐算法研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:zhaoxiufen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前大数据时代,互联网产业高速发展,数据信息迅速增长,信息过载问题愈发严重。在海量信息中,准确快速的获取用户所需信息,变得愈发困难。为解决这一困境,个性化推荐系统应运而生。协同过滤推荐算法作为个性化推荐算法的主流技术之一,具有推荐效果好,算法简单等特点。通过利用用户历史行为数据信息,对用户所需项目进行预测,提供个性化推荐。然而在实际应用中,协同过滤推荐算法出现了可扩展性差,评分数据稀疏以及用户隐私泄露等问题,导致最终推荐结果无法满足用户的真实需求。本文为解决协同过滤推荐算法中存在的问题,引入聚类分析技术和差分隐私技术,提高推荐精度,同时保障用户的隐私安全,主要研究工作有以下几点:(1)针对协同过滤推荐算法需要处理数据信息的增多,导致算法的可扩展性差问题,在协同过滤推荐算法的基础上引入聚类分析技术,提出基于差分隐私聚类技术的个性化协同过滤推荐算法。该算法与其它基于聚类分析协同过滤推荐算法的不同之处是:在对用户数据进行K-means聚类处理阶段,可以保证系统内参与推荐的用户隐私不被泄露,保障数据信息安全,并提高算法推荐性能。(2)针对用户数据进行K-means聚类算法产生的隐私泄露问题,分析现有隐私预算ε分配方法,设计基于聚类效果自适应分配隐私预算的差分隐私K-means算法(Adaptive Differential Privacy K-means,ADPK-means)。该算法评估每一次迭代产生聚类集合的效果,对不同的聚类集合添加不同的扰动噪声,由此减少多余噪声添加,并针对随机选取中心点导致聚类效果变差的问题,采用样本点平均差异度的方式选取初始中心点,保证用户隐私安全,并提高结果可用性。(3)针对协同过滤推荐算法利用用户私人信息进行推荐,产生的隐私泄露问题,设计基于聚类结果的差分隐私推荐算法。通过聚类分析技术搜寻相似用户群体,对产生的相似用户群体应用差分隐私保护,缩小添加噪声范围,有效解决直接采用差分隐私技术导致推荐性能不佳的问题。将ADPK-means算法与协同过滤算法结合,以用户属性数据为基础,对用户进行差分隐私聚类操作,保障聚类过程中用户的隐私安全。并对产生的聚类集合利用指数机制输出邻近用户集合,利用用户项目属性偏好特征和用户项目评分特征,对指数机制效用函数进行设计,提高推荐结果的准确性。对本文提出的算法进行理论上的安全性分析和实验结果分析,验证所提方法均是可行且有效的。
其他文献
甘肃省生态环境复杂,植物种类多样,伞形科饲用植物资源丰富.统计结果表明,甘肃省伞形科饲用植物共有7属14种,大多分布于温带的山坡、草地等地带,生活型多为多年生草本.研究结果可为了解甘肃省伞形科饲用植物的区系、化学成分以及饲用价值提供依据,为其合理开发和综合利用提供可靠保障.
随着“互联网+”时代的到来,教育信息化将推动教育教学的高质量发展,引领教育现代化。如何打造高效课堂,提高学生学习效率,是一线教师一直探讨的重要课题。通过“三主三段六环节智慧课堂教学模式”在初中数学课堂中的教学实践与探索,变革传统初中数学教学形态,利用大数据分析技术建立新型的信息化课堂。通过课前预习和测评反馈,确定教学的方向、方法;在课中通过实时检测和互动,实现教学的精准化;在课后通过智能化练习推送
本文介绍了核电厂辐射控制区出入监测系统的基本情况,基于在运核电机组的应用反馈和管理经验,分析了现有设计中存在的问题,结合新技术的发展和管理要求的提升,从网络架构、清洁控制区、自动配发、性能提升、剂量大数据等方面提出了改进优化建议,对防止污染扩散、提高剂量管控水平等有一定的意义。
孕妇补钙是增加孕妇自身钙含量,供给胎儿充足钙元素的一种方式,在保持自身钙含量与钙吸收需求的同时,也能够保证胎儿钙消耗需求。人们对于钙的认识多为钙能够促进生长发育,孕期补充适量的钙类元素,有利于满足胎儿的生长发育需求,也有利于避免孕妇缺钙造成的多种身体健康问题发生。所以孕期是需要补钙的,且孕期补钙十分重要。
期刊
教学论理应对教学实践有所关怀。这里所说的关怀显然不只是指一种学术性的情感关怀,而主要是指一种知行统一意义上的深层理性关怀。唯有如此,教学理论研究与教学实践发展二者之间才能形成良性的互动。在操作的意义上,教学论的实践关怀可以具体化为四种基本路径,即关怀教学实践的需要、关怀教学实践的理想、关怀教学实践的经验、关怀教学实践的困惑。对于教学论研究者来说,无论是为了认识还是为了实践,都需要了解教学实践的需要
为了给黄河三角洲地区野生饲用植物资源的开发和利用提供理论依据,对该区域的野生饲用植物资源进行了调查和研究,初步统计黄河三角洲地区野生饲用植物有40科118属172种。并介绍了该区域饲用植物的科属种组成、区系分布、地理分布及饲用价值等,并对其利用提出了一些建议。