论文部分内容阅读
社会标注系统中存在三种类型的推荐任务:标签推荐、资源推荐和用户推荐,这些推荐任务在帮助用户标注资源、获取信息及提升参与度方面具有着重要的意义。然而社会标注系统自由的使用方式导致的分类视角不一致、标注质量参差不齐及数据本身具有的过稀疏问题导致现有的社会标注系统推荐方法无法有效的给出推荐。因此,如何针对上述问题研究有效的适用于社会标注系统中异构对象的推荐方法成为了社会标注系统应用研究中的一个热点问题。本文研究社会标注系统中面向异构对象的推荐方法。针对社会标注系统自由的使用方式导致的分类视角不一致问题、标注质量参差不齐的问题,本文研究社会标注系统的数据预处理方法,通过识别分类与主题标签,及共识与非共识标签,对社会标注数据进行预处理,提升数据的质量。针对社会标注系统数据的过稀疏问题,本文研究融合关系与内容的社会标注系统异构对象统一推荐方法,及对应的个性化社会标注系统推荐方法,通过在异构对象分析中融入对资源内容的分析来提升数据密度,提升推荐质量。具体的,针对标签分类视角不一致的问题,本文以标签的语义实例为基础,通过分析并筛选标签间关系来构建标签层次体系,进而实现对分类标签和主题标签的区分。针对标注质量参差不齐的问题,本文使用关键词建模标签的语义,并应用基于KeyGraph的机会发现方法区分共识与非共识标签。针对社会标注数据的过稀疏问题,本文考虑通过引入其他类型的、具备稠密关系的对象补充推荐线索,改进推荐的质量。以LDA主题模型为基础,本文构建社会标注系统中标签、用户、资源及资源内容的概率生成模型,以条件概率描述社会标注系统中异构对象的关联,并通过研究模型的参数估计和模型推理方法实现对异构对象的统一推荐。在此基础之上,本文进一步研究个性化的社会标注系统推荐方法,通过扩展社会标注系统概率生成模型,建模用户对不同资源及标签的使用习惯,实现高质量的个性化推荐。