【摘 要】
:
信息技术的迅猛发展和大数据时代的到来,带来的是数据的井喷式增长,人们难以从海量的信息当中快速提取自己所需要的有价值信息,即导致“信息过载”现象的出现。推荐系统的出现有效地解决了这一问题,协同过滤推荐算法是目前应用较为广泛的推荐算法之一。但是传统的协同过滤算法忽视了用户偏好的时间可变性对推荐结果的影响,且面临着推荐准确率低和对数据稀疏性敏感的问题。本文针对关于时间的推荐算法中准确性问题和数据稀疏性问
论文部分内容阅读
信息技术的迅猛发展和大数据时代的到来,带来的是数据的井喷式增长,人们难以从海量的信息当中快速提取自己所需要的有价值信息,即导致“信息过载”现象的出现。推荐系统的出现有效地解决了这一问题,协同过滤推荐算法是目前应用较为广泛的推荐算法之一。但是传统的协同过滤算法忽视了用户偏好的时间可变性对推荐结果的影响,且面临着推荐准确率低和对数据稀疏性敏感的问题。本文针对关于时间的推荐算法中准确性问题和数据稀疏性问题展开研究。本文在基于隐马尔可夫模型的协同过滤推荐算法(A Hidden Markov Model for Collaborative Filtering,HMM-CF)基础上,引入用户选择频次和用户相似度权重因子,提出基于用户相似度权重和用户选择频次的隐马尔可夫协同过滤推荐算法(Hidden Markov Model Collaborative Filtering Recommendation Algorithm Based on User Similarity Weight and User Selection Frequency,HMM-CF-USW-USF)。本文的相关研究如下:(1)针对协同过滤推荐算法中的推荐准确性问题和数据稀疏性问题,首先引入用户选择频次,将用户对电影的评分转换为用户选择该电影的次数,并将用户选择该电影概率与选择该电影次数的乘积作为用户选择该电影的预测概率,继而提升推荐系统的准确性;同时引入用户相似度权重因子,利用用户对电影的评分求出用户相似度,再根据用户对电影类的选择关系对相似度进一步改善以缓解数据稀疏性的压力,最后将相似度转化为权重因子对隐马尔可夫模型参数的估计进行优化,提升推荐系统的推荐准确性。(2)本文通过两个真实数据集和四组实验对本文所提的HMM-CF-USW-USF算法的可行性和有效性进行验证。两个数据集分别为:用户在Movie-lens网站的电影评分信息,和用户在Netflix网站的电影分级行为数据。四组实验分别为:本文将未使用用户选择频次和用户相似度权重因子的HMM-CF算法作为对照组实验;在HMM-CF算法基础上结合用户相似度权重因子的算法作为实验组1;在HMM-CF算法基础上结合用户选择频次的算法作为实验组2;在HMM-CF算法基础上结合用户选择频次和用户相似度权重因子的算法作为实验组3。本文以精确率、召回率和1F度量值作为评价指标,对HMM-CF-USW-USF算法的性能进行评估。实验结果表明,引入用户相似度权重因子和用户选择频次均对推荐算法的性能有所提升。
其他文献
新生代以来,欧亚板块持续碰撞引发青藏高原及其周边区域发生大规模变形和持续抬升,形成低起伏的高原内陆和地势陡峭的高原东南缘坡降带。目前对于青藏高原东南缘地貌的成因尚
本文选用2010~2018年中国43家城市商业银行面板数据作为研究样本,对城市商业银行政府股权与风险承担之间的关系进行实证研究。目前,主流期刊文献较少直接从风险承担与政府持股入手研究两者之间的关系,并且绝大部分学者认为政府股权仅表现出对城市商业银行的掠夺效应,即提高城商行风险承担。与此不同,本文通过实证研究发现,对小型城市商业银行而言,政府股权与风险承担之间具有显著的U型关系,并且存在以政府持股比
随着人工智能技术的蓬勃发展,即时定位与建图(Simultaneous Localization and Mapping,SLAM)已然成为了智能自主机器人当中的关键技术,同时在自动驾驶以及增强现实等方面也有广泛应用。静态环境是大多数视觉SLAM的前提条件,一定程度上限制了它的实际应用。当移动物体进入相机视野中,传统SLAM将无法进行准确地跟踪定位,同时移动物体在环境中的随机运动也会污染重建的全局点
随着时代的进步和社会的发展,传感领域发展迅速,其在生物医学、城市建筑、环境监测、通信技术、机械控制等领域均有应用。其中干涉型光纤传感器由于具有结构简单、传输损耗较低、成本低廉、尺寸较小、抗腐蚀等优点,可以用于测量温度、应变、折射率(refractive index,RI)、湿度、曲率等环境参数。本文研究所用的基本理论是光传输特性和各个模式之间的干涉原理,分别设计出温度和RI双参量同时测量的干涉型光
从生物信息学形成早期到人类基因组计划的实施,人类对生命起源的探究逐步迈入后基因组和蛋白质组时代,这一步步的进程都伴随着序列比对研究,序列比对研究亦是生物信息学、计
随着我国经济水平显著提升,社会压力也随之增加,人们越来越重视知识和教育,农村落后的教育水平无法满足农村家庭希望孩子得到良好教育的需求,这样的现状之下陪读现象应运而生。由于家庭结构的转变、社会老龄化以及女性职业化的发展,从最初的母亲陪读到现在越来越多祖辈家长成为陪读的主力军,隔代陪读已经成为农村陪读的一种主要形式。农村隔代家长在面对生活环境变化、角色转化、旧支持网络断裂的情况下,可能会面临来自多方面
近十年来,志愿服务事业如雨后春笋般蓬勃发展,随着志愿服务事业的推动和互联网的进步,志愿活动中产生了海量志愿服务数据。如何处理和利用志愿服务数据,对志愿用户的行为进行指导,为志愿事业的参与者提供有价值的参考,成为亟待解决的问题。随着人工智能及互联网大数据的发展,“互联网+”志愿服务信息一体化工作也逐渐开展。对海量的志愿服务数据进行分析与研究,构建志愿服务领域的知识图谱,一方面以图谱的形式将复杂的结构
铁路企业混改基金是铁路总公司为推进铁路行业混合所有制改革提出的设想。铁路企业混改基金成立的必要条件就是不同利益主体之间能够达成良性合作。以铁路部门为代表的国有资本具有安全性要求,社会资本具有高收益要求,因此,在基金募资过程中需满足不同风险偏好投资主体的需求。本文使用演化博弈理论对铁路企业混改基金股东之间的博弈进行理论分析,同时结合系统动力学仿真方法,对博弈过程进行仿真模拟,来研究以铁路部门为代表的
塑料具有价格低廉,使用方便和功能多样化等特点,已经被广泛应用于我们的日常生活中,给人类的生活带来了极大的便利。近几十年来,人们对于塑料的需求越来越大,从而刺激了塑料产业的极大发展,造成全球每年生产的塑料总量越来越多。然而,由于塑料的难降解性,造成大量的塑料垃圾长期滞留在环境中,从而引发一系列严峻的环境问题并且对经济发展极为不利的。因此,如何有效的处理废塑料污染问题是全世界范围内亟待解决的难题,基于
近年来,随着大数据技术和计算性能提升,深度学习技术已经在图片分类、自动驾驶、面部识别及恶意软件检测等领域获得突破性发展。但最新研究表明,在样本数据中加入不易察觉的扰动就会导致深度学习模型以极高的置信度输出错误的预测结果,这严重危害了深度学习模型应用的安全性。目前对于对抗样本的研究主要集中在白盒攻击和单一扰动情境下,而黑盒攻击下的通用扰动具有攻击者所需知识少、攻击部署快等特点,是更符合现实场景的攻击