社会标注系统中面向异构对象的推荐方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:echo1108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会标注系统中存在三种类型的推荐任务:标签推荐、资源推荐和用户推荐,这些推荐任务在帮助用户标注资源、获取信息及提升参与度方面具有着重要的意义。然而社会标注系统自由的使用方式导致的分类视角不一致、标注质量参差不齐及数据本身具有的过稀疏问题导致现有的社会标注系统推荐方法无法有效的给出推荐。因此,如何针对上述问题研究有效的适用于社会标注系统中异构对象的推荐方法成为了社会标注系统应用研究中的一个热点问题。本文研究社会标注系统中面向异构对象的推荐方法。针对社会标注系统自由的使用方式导致的分类视角不一致问题、标注质量参差不齐的问题,本文研究社会标注系统的数据预处理方法,通过识别分类与主题标签,及共识与非共识标签,对社会标注数据进行预处理,提升数据的质量。针对社会标注系统数据的过稀疏问题,本文研究融合关系与内容的社会标注系统异构对象统一推荐方法,及对应的个性化社会标注系统推荐方法,通过在异构对象分析中融入对资源内容的分析来提升数据密度,提升推荐质量。具体的,针对标签分类视角不一致的问题,本文以标签的语义实例为基础,通过分析并筛选标签间关系来构建标签层次体系,进而实现对分类标签和主题标签的区分。针对标注质量参差不齐的问题,本文使用关键词建模标签的语义,并应用基于KeyGraph的机会发现方法区分共识与非共识标签。针对社会标注数据的过稀疏问题,本文考虑通过引入其他类型的、具备稠密关系的对象补充推荐线索,改进推荐的质量。以LDA主题模型为基础,本文构建社会标注系统中标签、用户、资源及资源内容的概率生成模型,以条件概率描述社会标注系统中异构对象的关联,并通过研究模型的参数估计和模型推理方法实现对异构对象的统一推荐。在此基础之上,本文进一步研究个性化的社会标注系统推荐方法,通过扩展社会标注系统概率生成模型,建模用户对不同资源及标签的使用习惯,实现高质量的个性化推荐。
其他文献
随着Internet技术的飞速发展,互联网上日益增加的用户和分布广阔的数据,给分布式存储技术带来了新的挑战。如何在动态的网络环境中构建大规模、高可靠、高性能、安全的分布式存
网格是将互联网连接的所有资源整合成一台超级虚拟计算机。校园网格是网格技术在校园范围内的实现。将校园网内的各种计算资源以有效的方式动态的组织起来,隐藏其内部异构性和
网格是21世纪发展起来的构筑在互联网上以实现资源可控化共享为目的的基础设施。它将高速互联网、高性能计算机、大型数据库、传感器等连接在一起,建立起开放的、面向服务的体
关联规则挖掘是数据挖掘领域中一个重要的研究方向,它反映了一个事物与其他事物之间的相互依存性和关联性。IBM公司Almaden研究中心的R.Agrawal首次提出关联规则的模型,并给出求
移动通信技术的不断成熟和智能终端设备的广泛应用,为移动社交网络(MSN, Mobile Social Networks)的提出和发展奠定了坚实的基础。作为一种全新的应用模式,园区型MSN是现实社
CPS(信息物理融合系统)是随着计算技术,控制技术等迅速发展起来的新一代系统,它是建立在嵌入式计算,无线传感器网络基础上的,具有广泛的应用前景。CPS系统已经成为很多国家和
随着各种IP业务的迅速增长,在统一的IP网络平台上提供多种业务已经成为业界的共识。但现有的IP网络“尽力而为”的传输模式使其无法满足多媒体应用和各种用户对网络传输质量的
特征造型技术是新一代CAD/CAM集成系统的关键技术之一,是产品模型设计的核心。参数化技术和变量化技术是提高特征造型系统设计效率的两种主要方法,基于特征的参数化技术和变量
粗糙集理论是20世纪80年代初由波兰数学家首先提出的一种刻画不确定和不完备知识的数学工具,能有效地分析和处理不精确、不一致、不完整等各种信息,并从中发现隐含的知识,揭
图像信息丰富,数据量大,如何对图像数据进行压缩处理,目前已发展成为专门的研究领域——图像压缩编码。如何有效地组织、存储、传输和恢复图像数据,即探索更有效、更高压缩比的图