论文部分内容阅读
第三次工业革命以来,尤其是1989年万维网的出现,使得网上的信息量逐年呈指数级增加,在互联网上,各种形式的信息以不同的类型呈现在网页上:如文字、图像、视频、音频、图表等等。在众多的网络信息媒体中,电影视频作为人们喜闻乐见的内容需求具有广大的受众。电影视频作为文化娱乐的重要内容,相比文字能传递更多的信息,影视传媒在人们的精神生活中发挥着其它媒体所无法比拟的作用。因此对于电影视频推荐网站,如果用户在网站中查找感兴趣的电影时,需要花费大量的精力筛选感兴趣的视频,这无疑降低了用户的体验,也不利于网站的发展。因此,越来越多的网站引入了推荐算法,由此给用户提供一些建议,将用户可能感兴趣的影视内容展现在用户的眼前,供用户筛选。传统的电影推荐算法一般利用评分矩阵计算用户之间的相似度,选取目标用户的最近邻居集,然后进行推荐。但是普遍存在数据稀疏、推荐准确率低等问题。本文针对这些问题,对传统的电影推荐算法进行研究,并加以改进。主要工作如下:(1)梳理归纳了经典的电影推荐算法及其应用,以及一些学者对推荐算法的研究成果。针对传统电影推荐算法的优缺点进行分析,并思考如何用最新技术来提升推荐的性能。(2)目前电影推荐网站可以分为两类,第一种是只有评分和评论,但用户不可以打标签,例如爱奇艺、腾讯视频,第二种是用户可以打标签,例如豆瓣电影,针对第一种情况存在的评分矩阵数据稀疏问题,本文通过用户的电影评论提取用户的电影偏好特征,进而构建偏好相似度矩阵,然后将其融入到SVD++模型中,提高评分预测的结果。针对第二种情况,通过用户观看过的电影的标签来获取用户感兴趣的电影类型,同时考虑用户共同所在的电影兴趣小组数,用户关注列表的重合度,根据这三个因素计算用户之间的相似度,选取近邻用户,然后作进一步的推荐。(3)本文在进行电影推荐前,综合考虑了待推荐电影评论的情感倾向值、评论的点赞数、电影热门程度等因素,引入了电影推荐指数的概念,相比仅考虑单一因素更客观,提高了推荐的效果。最后,本文通过对比实验对所提推荐算法与其他算法在不同评价指标上进行验证,通过实验验证了本文提出的基于改进的SVD++和用户行为分析的电影推荐算法能有效解决了数据稀疏性问题并在一定程度上提高了推荐效果。