论文部分内容阅读
迅猛发展的互联网资源致使用户可随意获取海量的媒体、文档信息以及服务等,与此同时,资源的快速增长也导致了资源过载的问题。用户在拥有着庞大信息数据资源的同时,却也深陷于难以发现真正感兴趣的内容的窘境。在这种情况下,由信息过滤演变成的推荐系统就显得尤为重要,它可以帮助人们发现感兴趣的项目,例如电影,书,新闻,图片或者网页等。然而,随着人们需求的逐渐增长,用户越来越依赖对其独特偏好进行个性化定制的推荐系统。诸如此类的推荐系统通常都需要记录和分析计算大量的用户行为数据,然而随着用户数量逐渐增大,需要记录的行为数据越来越多,传统的推荐算法不仅在物理存储上承受着巨大压力,无法实时高效地处理数据量较大的数据集等问题,且在用户信息较为稀疏的数据集下表现欠佳。近期,研究人员发现仅仅基于谁评价了什么来记录用户行为的二值化推荐系统,而非基于实际评分的推荐系统能不仅能在一定程度上缓解存储压力,还能得到更准确的推荐结果并且具有更强的鲁棒性,因此研究并实现一个基于二值化的推荐系统具有重大意义。本文深入研究并分析了当前推荐系统的现状,对推荐系统的概念、原理、目前主流的推荐算法以及常用的评价指标做了深入的了解,归纳了各个推荐算法所适用的领域,并比较了它们的优缺点。在此基础上,为了提高推荐系统的实时性并解决冷启动问题,本文做了如下几个工作:第一,针对现有的推荐系统实时性不高的问题,本文引入了二值化推荐模型(BCNN)来提高推荐的效率。通过将输入推荐系统的矩阵数据二值化来简化卷积神经网络中的卷积操作,可将卷积中的乘法操作转化为异或操作,节省了大量计算时间,从而提高了模型的推荐效率。本文将BCNN推荐模型在公开的Movielens数据集上训练并与基于支持向量机(SVM)、基于逻辑回归(LR)的推荐模型进行实验对比分析,实验结果表明BCNN在保证一定推荐精度的情况下,推荐模型在效率上有着明显的优势。第二,推荐系统通常在用户行为数据较为稀疏的数据集上表现较差,这种情况称为推荐系统的冷启动问题。为了解决这个问题,本文结合用户的偏好信息来提高推荐质量,在BCNN推荐模型的基础上,引入了 RBF径向基网络构建亲属关系群组得到融合RBF的二值化网络推荐模型(RBFCNN)来实现该项操作。该模型的主要思想是通过收集和分析用户的行为数据预测出用户偏好信息,利用RBF网络将有相似偏好的用户进行聚类操作,最终生成用户可信任的亲属关系群组,让推荐在群组内进行。本文通过实验验证了 RBFCNN模型的推荐效果,并与基于BCNN、SVM以及LR的推荐模型进行实验对比分析。最终实验结果表明RBFCNN模型不仅保证了实时性,并在一定程度上也解决了推荐系统的冷启动问题,且在稀疏程度不同的数据集下推荐效果都较为良好且稳定。