论文部分内容阅读
近几年,互联网进入迅猛发展的阶段,与此同时,各式各样的网站也得到了快速发展,标签系统慢慢的成为Web2.0时代海内外研究学者十分感兴趣的热点方向。标签可以帮助广大用户群体对物品进行分类以及注释,越来越多的用户使用标签进行对物品进行标注。一方面,标签可以表示用户的兴趣爱好;另一方面,标签也代表了物品的描述信息,一个优秀的标签系统往往可以在用户给物品打标签的时候给出令用户满意的标签推荐列表,以提高用户打标签的质量,标签推荐算法由此产生。常用的标签推荐算法通常包括基于协同过滤的推荐算法、基于内容的推荐算法以及基于图的推荐算法。基于图的FolkRank标签推荐算法因其能够有效的利用用户、物品以及标签之间的关系,所以FolkRank能够达到更优的标签推荐性能。但是,FolkRank算法没有考虑用户-用户、物品-物品、标签-标签之间的内部关系;此外,FolkRank标签推荐算法及其他Top-N标签推荐算法的推荐列表长度常为固定值,这将导致推荐精度的下降,用户体验感差。针对以上提出的两个问题,本文的创新点总结如下:1、针对FolkRank标签推荐算法并没有充分利用图中用户-用户、物品-物品之间内在联系的问题,本文提出了一种改进的FolkRank标签推荐算法,该算法能够更充分的考虑标签系统当中用户-用户、物品-物品之间的内在关系。以上工作主要从两个方面完成:(1)根据属性信息寻找目标物品的近邻物品,根据用户给物品打标签的历史行为信息进一步获取目标用户的近邻用户集合。(2)在三部图中,计算每个物品节点的加权度,以此作为评价物品重要性的指标,根据物品节点的重要性对目的物品的近邻物品给予初始权重;根据用户标记物品的行为为近邻用户分配初始权重。2、针对FolkRank标签推荐算法推荐列表长度常为固定值,进而导致推荐精度下降的问题,本文提出了一种优化标签推荐算法Top-N推荐列表长度的算法。以上工作主要从两个方面完成:(1)首先将大于Top-1标签分数的1/2的标签加入候选推荐列表,通过定义成对标签置信度指标,计算候选列表中的标签与Top-1标签的相关性,并按照相关性的大小顺序,完成推荐列表的重排序。(2)对重排序后的标签推荐列表,通过计算每个子列表的相关性系数,相关性系数最高的子列表即为最佳推荐列表长度。本文在多个真实数据集进行了多次对比实验,并与FolkRank等常用的标签推荐算法进行了比较。结果表明,本文提出的以上两种方法均具有较好的推荐性能。