论文部分内容阅读
Web2.0环境下,互联网已成为全球最大的信息资源库,大量的信息在给人们带来诸多便利的同时,也不可避免地导致了“信息泛滥”、“信息迷航”等问题。个性化信息推荐可以根据Web用户的信息需求主动向Web用户提供合适的信息,成为解决这些问题的重要手段之一。在标签系统中,“用户—资源—标签”之间的关系网络为个性化信息推荐提供了十分有价值的基础数据,但已有的相关研究主要从关系网络的结构特征来分析用户之间的关系,忽视了标签系统中丰富的语义信息,制约了基于社会网络的个性化信息推送模型的质量。因此,本文通过构建标签的概念空间发掘标签之间的语义关系,进而将概念空间与社团发现相结合,提出融合概念空间模型的语义社团发现方法,最后根据语义社团结构特征构建个性化信息推荐模型。本文的研究主要包括三个方面的内容:第一,构建基于标签的概念空间。标签可被视为由用户主动生成的一种元数据,标签体现了用户的认知结构特征,包含了丰富的语义信息。利用标签对用户进行聚类后,同属一个类别的各个用户的兴趣结构存在相似的可能性,彼此之间产生信息互动关系的概率也会相对较大。由此,本文首先通过标签聚类形成标签主题,然后通过构建空间向量、关联矩阵、相似性矩阵等操作构建基于标签的概念空间模型,实现标签主题语义层次分析,为后续利用标签对用户进行聚类奠定基础。第二,提出融合标签概念空间的语义社团发现算法。基于标签的用户聚类将具有相似认知结构的Web用户聚集在一起,在标签系统中可以通过这种聚类来构建隐性的社会网络。本文针对每个标签主题内部的隐性社会网络,提出融合标签概念空间的语义社团发现算法,将网络内部节点的标签语义(概念空间模型)引入到社团发现过程中,使得社团内部用户语义相似度尽可能大,社团外部用户语义相似度尽可能小。在具体实现过程中,首先根据隐性社会网络内部用户使用标签的频次、用户使用标签对应的TF-IDF值来计算用户之间的相似度,并根据相似度的大小来衡量用户之间的亲疏程度,从而形成用户之间的关系网络。然后借鉴SemTagP算法的思想,在社团发现过程中充分考虑社团内部节点的语义信息,将概念空间模型与社团发现有机融合,实现语义社团的划分。第三,基于语义社团实现个性化信息推荐。语义社团的划分是基于每个标签主题所对应的隐性社会网络,因此,本文的个性化信息推荐仅针对每个隐性社会网络内部形成的社团结构。由社团结构的基本特征可以得出:同属一个社团的Web用户的兴趣具有较大的相似性,而不同社团的WWeb用户的兴趣具有较大的差异性。因此,社团内的个性化信息推荐可以借鉴协同过滤思想来实现,社团间的个性化信息推荐则考虑分属不同社团的两个节点之间可能存在强联系的情形,利用扮演“信息桥”角色的节点实现社团间的个性化信息推荐。