论文部分内容阅读
做为处理信息过载的有效手段,推荐系统在近些年得到了广泛的研究与发展,推荐系统在各领域应用的成功案例也不断涌现,但是依然面临着很多问题亟待解决。形式概念分析(Formal Concept Analysis,FCA)的核心数据结构—概念格(Concept lattices),是一种数据分析与规则提取的有效工具。外延与内涵做为概念的组成部分使得形式概念展现出了聚类的特性。概念之间存在的偏序关系也揭示了其泛化与特化的本质。随着其研究的不断深入,形式概念分析开始逐步应用于数据挖掘、信息检索等领域。协同过滤(Collaborative Filtering,CF)推荐作为应用最广的推荐策略之一,其中经典的基于邻域的协同过滤算法通常只考虑用户间或项目间的相似关系,而忽略了不同对象之间的内在联系。此外越来越多的研究人员发现,推荐系统往往面对的是无法直观反映用户喜好程度的隐式数据,并且随着产品种类的剧增,用户与项目间产生的隐式数据也会变得极为稀疏。所以由于稀疏数据环境下信息的缺失,协同过滤算法往往获取不到充足的邻域信息,从而直接影响了最终的推荐效果。针对以上问题,本文提出了一种面向隐式数据的基于概念邻域的协同过滤推荐算法(Conceptual Neighborhood-based Collaborative Filtering,CNCF)。该算法针对Top-N推荐问题,以概念格为载体进行推荐问题求解。首先在用户与项目的关系数据转化而成形式背景的基础上进行概念格的构造,将用户与产品分别以对象与属性的形式聚集在概念中,并基于概念格生成相应的起始概念索引,借助索引结构高效地对对象的起始概念进行定位。之后利用概念之间的偏序关系,以对象(用户)的起始概念为起点探索其近邻概念并获取候选项集。最后结合所提出的全局偏好度与邻域偏好度筛选出用户可能感兴趣的推荐列表。通过对CNCF算法的实现,并在两个真实数据集上进行实验验证,相较于传统基于邻域的协同过滤推荐算法,CNCF算法在可以在保持较好的推荐效果同时,更适用于数据稀疏环境下的推荐。