论文部分内容阅读
随着互联网覆盖越来越多的人群,也越来越深入我们生活的各个方面,人们一方面从中获得了许多的便利,另一方面又被爆炸式增长的数据弄得难以决策。因此,我们需要根据用户的个性化需求提供更加精准服务,以提升信息交换和利用的效率,而推荐系统就是实现这一目标的重要途径。推荐系统走过了从基于内容到协同过滤的发展阶段,一度淡化了内容的价值。而如今随着用户生成内容发挥着越来越重要的作用,我们需要重新审视内容的巨大潜能。 在值得利用的用户生成内容之中,文字占有统治地位,而理解和利用这一信息的重要领域——意见挖掘,也持续火热。尽管如此,它与推荐系统还未能实现很好的结合。本文则通过分析现有推荐系统的优缺点和意见挖掘领域达成的成果,提出了基于意见挖掘的混合推荐模型,实现了意见挖掘在推荐系统中的应用。 该模型利用了双向扩张意见提取技术,从无结构的用户评论之中获取了大量可以描述用户和物品特性的结构性的数据,再通过线性回归模型得到用户每个意见的具体分值。另一方面,在用户对物品各属性评分已知的情况下,本文提出了基于用户权重的启发式的回归模型进行评分预测。将以上两个模型综合,最终可以得到同时训练意见分值和用户权重的混合推荐模型。针对该模型求解上的困难,本文将问题拆分为了两个线性规划问题交替迭代求解。该算法被用于TripAdvisor旅店评论数据集,并获得了成功。除了数据指标上的比较,本文还通过实际应用案例,展示了意见挖掘在提升推荐系统可解释性上能取得的显著效果。