基于条件随机场的标签推荐问题研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:musicwen5918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标签推荐是一个新的研究方向,其旨在为目标资源自动添加标签作为描述信息,来缓解标签空间噪声数据增多、标签指代内容模糊等现象。目前,标签推荐方法主要有基于内容的方法、基于协同过滤的方法以及基于图的方法,但这些方法都没有考虑标签间的依赖关系。而在标签系统中,标签之间具有很强的依赖关系,利用这种依赖关系会提升推荐的性能。   针对标签推荐研究中忽略标签关系这一问题,本文提出将标签关系融入推荐模型来改进推荐性能。在推荐过程中,使用排序值衡量候选标签与资源的相关。性,排序值越大表示两者越相关。本文使用条件随机场(CRF)模型对候选标签进行排序,该模型引入标签间的关系信息,从排序输入向量和候选标签间的共用关系两个方面计算排序结果。具体来说,本文的主要内容如下:   本文首先对标签推荐已有算法进行简单的描述和分析,并对条件随机场模型进行介绍。   接着,研究和实现标签推荐算法。本文先分析和实现目标算法的基础算法——基于最大熵理论的标签推荐(ME-TR)算法。在此基础上,引入标签共用的依赖关系,提出基于条件随机场的标签推荐(CRF-TR)算法。在大规模的数据集上,标签数据较丰富,使用标签对共用关系的CRF-TR算法的推荐性能优于ME-TR算法。   最后,对本文提出的算法进行实验验证与分析。实验的结果表明,引入标签关系信息的CRF-TR算法的性能优于其他的算法。将提出的CRF-TR模型应用到“杏坛——汉语学习网”的课程标签推荐中,实现了在线课程标签推荐系统,取得了较为理想的推荐结果,具有很好的推广性。
其他文献
经典粗糙集理论是一种处理不完整数据的有效方法,但它要求目标数据的分类必须精确。变精度粗糙集理论则是在经典粗糙集理论的基础上引入了错误分类率β,将经典粗糙集理论中的集
P2P(Peer-to-Peer,对等端到对等端)作为一种与客户机/服务器对立的网络架构,是近年来兴起的一种重要的网络应用模式。它在文件交换、对等计算、协同工作、搜索服务等方面都有着
随着计算机系统和互联网技术的发展,现在各企业对数据的依赖性逐渐增强,对数据完整性和安全性的要求也越来越高,各种数据容灾技术在这种需求背景下得到了迅速发展。连续数据保护
20世纪以来,随着计算机技术、通信技术、互联网技术的突飞猛进和电子商务、网上银行等的兴起,信息安全受到越来越广泛的关注,同时随着物联网、无线传感器、RFID标签的出现,分
作为模型的降维表示,中轴在模型检索、路径规划、模型表示、三维打印、有限元分析等方面获得了广泛的应用。然而,目前的三维模型中轴生成方法如瘦化法、Vonoroi图法、跟踪法等
随着新一代互联网规模地迅速增长,网络技术的不断完善与成熟,特别是交互式网络多媒体服务越来越广泛的应用,如何提供高水准的服务质量(Quality of Service,QoS)成为计算机网络领
鉴于关键词查询在IR和Web中检索文档的理论和技术方法,在关系数据库中支持自由态的关键词查询成为一个活跃的研究课题。关键词查询能够更好地适应Web数据库,不需要用户知道数
数字水印以数字作品内容保护为主要宗旨,已经被广泛的研究。近年来,学者也提出许多不同的算法。鲁棒水印嵌入容量虽然较低,但却能抵抗各种非恶意的篡改。在一些应用场合中,出于对
近年来,随着移动定位和无线网络技术的发展,人们可以更加方便地测定自己的地理位置,一种新的应用服务--基于位置的服务应运而生。人们为了获得基于位置的服务需要将自己的精确位
近年来,随着各大高校每年招生数量的逐渐增多,高校宿舍管理工作人员的工作量越来越大,效率却越来越低,如何充分利用Internet和计算机技术为高校的宿舍管理工作以及学生的日常生活