论文部分内容阅读
近年来,互联网使用者日益增多,各大网站的注册使用者和网站中的内容条目也在快速增长,这一现象加剧了用户信息选择困难的问题。推荐模型应运而生,其使用用户的历史记录、物品的属性数据以及实时跟踪用户需求改变来对用户提供个性化推送。推荐系统目前已经广泛应用于网络,不仅仅能实现精准推荐,节省查找时间,而且能为企业或商家带来大量商机,提高商品尤其是长尾物品的销售量。 单一的推荐方法总会产生不同的问题,目前学者们的研究重点已经由单个的推荐算法转移到混合推荐算法,说明混合推荐技术的发展非常重要,在学术领域具有较高的研究意义。本文将基于内容的推荐算法分别与基于用户和基于物品的协作过滤推荐算法结合,利用内容的属性数据求解用户-用户以及物品-物品的相似程度;将流行度数据联合基于用户的协同过滤推荐模型,利用流行度指标来调节物品之间的相近水平;将SVD与协同过滤推荐模型联合,运用其分解后的评分矩阵来求解用户-用户的相似水平。融合后的四种方法可以解决推荐系统因空缺值较多而产生的稀疏问题,以及用户和物品刚进入系统而无法产生推荐的冷启动问题。 对一次融合后的算法,本文利用组合预测对其二次混合,即组合推荐。组合推荐通过Shapley值来求解成员模型的权重参数。在系统的参数研究方面,本文利用Shapley值确定了组合推荐的权重参数;对TOP-N类型的N参数进行了讨论,给出了选取的结果趋势;对组合推荐的算法个数进行比较分析,确认了高可信度组合推荐模型的组合个数及对应的成员模型。在系统的性能评估方面,本文不仅与四个成员模型的结果进行对比,还和误差占比的混合推荐算法进行结果对比。针对推荐系统的评分预测类型,本文采用定量指标平均绝对误差和均方根误差来进行模型评估;对于推荐系统的TOP-N推送形式,本文采用准确率和召回率来评判模型。当准确率与召回率相矛盾时,采用PR曲线以及F值来进行综合评判。最后结果与预期一致,通过Shapley值确定权重的高可信度的推荐模型无论是在理论解释还是在数值模拟方面,都优于对照组的算法,可以有效提高推送精度。