论文部分内容阅读
随着近几年人工智能技术的迅速发展,推荐系统作为人工智能领域的应用之一,开始融入人们的日常生活。它从用户兴趣、海量的用户行为数据中智能地过滤出用户所需的内容,帮助人们更好地进行参考与决策。早期,以谷歌、百度为代表的搜索引擎都是以用户搜索内容进行展示,但它们的推荐局限于用户的思维。不同于搜索引擎,推荐系统更注重于主动为用户提供优质的内容,架起了用户与信息的桥梁。如今,互联网公司都会将它们紧密结合起来,帮助用户更好地体验信息服务,提升用户交互的满意度。QQ、微信、微博等社交平台现已不能满足年轻人的社交需求,且传统的视频网站缺乏用户之间的互动,于是“A站”、“B站”等视频社交网站诞生了。以B站为例,截止2017年9月底,通过爬虫得到的数据进行初步统计,B站用户注册数已突破2亿,视频投稿数量已达到1490万。为了增加用户的粘性,达到优质的视频推荐效果,本文探讨了常用的推荐算法。从大量的用户信息、视频信息、评分信息中挖掘用户的喜好,实现个性化推荐。在某种程度上,为用户节约了大量的搜索时间和决策时间,大大提高了推荐的实用性。本文采用用户显式反馈数据为用户进行推荐。相比隐式数据,显式数据它的情感色彩更为强烈,包含了用户感兴趣和不感兴趣的内容,即正负样本都存在而不需要根据数据构造负样本。而且,它是目前最经典、最常用的推荐方案。为了实现一个完整视频的推荐系统,本文做了如下的研究工作:1、数据源获取:采用多线程的方式通过网络爬虫爬取“哔哩哔哩”APP。该数据源包含了用户信息、视频信息、评分信息。其中,用户信息包含了用户的关注列表,为引入社会化推荐算法提供了数据支撑。2、探讨推荐算法:基于记忆的协同过滤算法、基于模型的推荐算法、基于特征内容过滤的方法、关联规则方法以及对数似然比方法。在这基础上,加入了社交网络元素,提出了改进的基于社会化的推荐算法。3、算法实验对比:结合探讨和提出的推荐算法,通过线下检验指标进行度量。常用的线下检验指标有均方根误差和分类效果度量方法两种,它们分别从预测分数和预测相关性两个角度去评价算法,具有现实指导意义。4、搭建视频推荐网站:选择Python编程语言,可保证前后端框架语言的一致性。使用最新的Django2.0 Web框架,具有一定的时效性和研究价值。选用编写灵活、稳定、高质量的Bootstrap来渲染页面,增加了界面的可观赏性和用户的体验感。