【摘 要】
:
随着互联网的迅速发展,网络上存在的信息呈指数级增长,用户从这些海量而复杂的数据中筛选自己感兴趣的内容的难度也随之增加。推荐系统作为一种有效的信息过滤工具,得到了广泛的应用,它的目的是准确地预测用户对物品或信息的偏好程度,从而把对用户更有价值的内容优先呈现给他们,帮助用户做出快速的决策。协同过滤在推荐算法中被广泛应用,它是基于相似用户具有相似偏好的假设进行推荐的,但是当用户的历史评分数据很少或没有评
论文部分内容阅读
随着互联网的迅速发展,网络上存在的信息呈指数级增长,用户从这些海量而复杂的数据中筛选自己感兴趣的内容的难度也随之增加。推荐系统作为一种有效的信息过滤工具,得到了广泛的应用,它的目的是准确地预测用户对物品或信息的偏好程度,从而把对用户更有价值的内容优先呈现给他们,帮助用户做出快速的决策。协同过滤在推荐算法中被广泛应用,它是基于相似用户具有相似偏好的假设进行推荐的,但是当用户的历史评分数据很少或没有评分时,推荐系统会面临着数据稀疏性和冷启动问题。因此,越来越多的研究者提出将多源数据作为辅助信息融合到推荐系统中提高推荐的性能。但是,推荐系统收集的用户评分等历史反馈数据,不可避免的涉及到用户的隐私信息。随着用户的隐私保护意识的提高,人们在享受推荐服务的同时也越来越关注自己的隐私能否得到保护。而基于数据融合的推荐中,由于涉及到多源数据,并且数据之间存在的关联给攻击者带来更强的背景知识,其隐私问题更具挑战性。因此,本文分析了现有的数据融合推荐中的隐私问题及已有方法的不足,提出了对数据融合推荐中的隐私保护方法的改进方案,主要研究成果如下:(1)针对融合知识图谱的新闻推荐系统中的隐私保护方法不能均衡噪声添加和推荐效果的问题,提出融合知识图谱的新闻推荐中的隐私保护方法,基于差分隐私模型设计一种二阶段隐私保护机制。首先,根据特征向量对推荐结果的影响权重动态地分配隐私预算,并将拉普拉斯噪声添加到用户特征向量中,实现隐私保护的同时降低过量噪声添加造成的数据损失,以提高数据的效用性。其次,对加权的用户特征向量添加统一的拉普拉斯噪声,保证用户数据的安全性。最后,在真实的新闻数据集上进行实验验证表明,该方法在保护用户隐私的同时能保证模型的预测性能。(2)针对融合情感分析的推荐系统面临的数据稀疏性问题,提出改进版的基于神经网络的观点挖掘模型Neu O+(Neural-network based Opinion mining+),将用户的ID特征中隐含的固有属性特征融合到推荐系统中,缓解数据稀疏性从而增强推荐性能。另外,针对融合情感分析的推荐场景中存在的隐私问题,提出一种基于差分隐私的观点挖掘模型DPNeu O,通过在梯度下降最下化损失函数获取优化参数的过程中,添加满足差分隐私的噪声来保护隐私。最后,在两个真实的数据集(Amazon、Yelp)上设计对比实验对本文提出的方法进行验证,表明本文方法相比已有工作能在保护隐私安全的同时提高推荐的精准度。
其他文献
随着人工智能技术的兴盛和互联网的普及,电子商务为企业带来了发展的新契机。目前,人工智能可应用于电子商务的各个方面,例如电子商务领域中的智能客服。但是,现有的智能客服只能根据顾客输入中的关键字简单地回应顾客,无法进行自动谈判。另一方面,当前的电子商务应用每天都会产生大量数据,这些数据在电子商务中是很有价值的。例如,我们可以使用大数据向顾客推荐商品。除此之外,大数据还可以用来帮助买卖双方之间进行谈判,
随着社会的进步,经济的不断发展,20世纪70年代起光纤传感技术得以快速发展,而双马赫-曾德尔(M-Z)干涉光纤传感系统具有结构简单、灵敏度极高、信号处理容易、方便解调、成本低等优点,在周界安防和管道泄漏检测及桥梁大坝、大型设施建设项目等领域得到了广泛的研究和应用。双M-Z光纤传感定位系统利用外界入侵扰动引起干涉信号的相位发生变化,再通过干涉解调成光强度变化,由光电探测器转化为电信号,利用互相关算法
针对平方根容积卡尔曼滤波高斯混合概率假设密度 (Square Root Cubature Kalman Filter Gaussian Mixture Probability Hypothesis Density, SRCKF-GM-PHD)算法在高杂波条件下对非线性目标跟踪能力弱的问题,该文首先融入改进灰狼算法,实时调节过程噪声Q和量测噪声R。其次,结合改进的渐消因子思想,实时调整SRCKF-G
在人工智能界,常识知识获取一直是公认的核心难题。所谓常识,是指日常生活中人与人之间存在的共识。人们的观念不断改变,常识也在不断发展。常识知识在自然语言处理、计算机视觉等领域都有着广泛的应用,但常识具有隐含性、大规模性、无领域性等特性,并且常识的理解机制尚不明确,使得常识知识获取成为限制人工智能发展的瓶颈问题。目前,根据自动化程度可以将常识获取的方法分三类:手工获取能够得到隐式的常识,但耗费大量的人
在互联网以及信息技术飞速发展的今天,物联网(Internet of Things,IoT)的研究得到了广泛的关注和重视,我国已经将物联网列入了国家的五大新兴战略性产业之一.物联网按照特定的网络协议将物体接入互联网,进行数据的交互,使得物物相连.随着人们生活水平的提高,物联网正在被逐渐被应用到家庭之中,例如家庭中的安防系统,灯光控制系统,温度检测系统等,物联网技术在家庭中的应用使得人们生活变得更加安
道路是现代交通的主要组成部分,对于管理和更新地理信息系统数据库中的道路信息非常重要。遥感图像数据已经迅速成为自动提取道路网络的主要数据源,它可以提供高精度的地面信息以及更复杂的背景细节,还可以进行大规模的道路监控,给道路提取带来了很大的改进空间,然而目前视觉判读仍然是更新道路的主要方式,这种方式成本高、需要耗费大量的时间和物力,给自动提取道路任务带来了影响。高分辨率遥感图像中的道路具有较大的类内差
人脸表情蕴含着丰富的情感信息,在人际交往沟通中起非常关键的作用,如何让计算机正确的识别理解人脸表情信息是一项具有重要意义且极具挑战性的工作。随着深度学习的发展,利用深度学习技术实现人脸表情识别成为了表情识别领域新的研究热点。人脸表情特征大多集中在人脸的局部关键区域,如眼睛、眉毛、嘴巴及其周围区域,人们可以忽略人脸的整体信息,而直接借助人脸的局部关键区域信息,来正确的识别人脸图像中的表情类别。因此,
随着教育信息化的发展,可视化教学成为教育研究者关注的热点之一。如何运用信息技术将可视化教学与学科教学融合的方式来发展学生的科学素养是亟待解决的重要课题。由于晶体结构与性质内容具有抽象性、微观性和复杂性等特点,并且该内容对学生的空间想象能力和立体几何知识要求较高,因此教师在进行讲授时很费力。2017版课标提出教师可以借助实物模型、计算机软件模拟和视频等多种直观手段,降低教学内容的抽象性,促进学生对相
视觉目标跟踪是计算机视觉领域中的重要研究方向之一,它被广泛应用在很多领域,其中主要应用在视频监控、自动驾驶和军事指导等领域当中。在当前主要以孪生网络作为发展的目标跟踪方法当中,候选目标区域中推荐的质量显得十分关键。模型更新问题也成为相应目标跟踪方法中的重要研究内容。当前跟踪方法大多数都是采用锚点固定作为推荐的一种方式,该方式所生成的候选区域数量都是非常庞大的,但是质量并非很高。并且在孪生网络中,目
基于皮尔逊相关系数的决策树(PCCDT)算法是决策树领域的一种贪婪型算法。其广泛应用于模式识别和信息检索领域,能够帮助医疗机构更精准地对病人进行诊断,帮助企业或个人更好地做出决策等。然而,当数据集中包含个人敏感信息(如病人的诊断信息,顾客的购物信息等),在决策树使用过程中遭到具有一定背景知识的恶意用户攻击时,个人的隐私安全就会受到威胁。如何在决策树使用过程中对敏感信息进行保护,同时又能保证决策树的