基于用户评论和评分的协同过滤算法研究

来源 :北京交通大学 | 被引量 : 11次 | 上传用户:fayo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,协同过滤算法在推荐领域受到了广泛的关注及应用。传统协同过滤算法利用用户评分进行推荐,然而随着用户和商品数量的不断增加,评分数据的稀疏问题成为了制约传统协同过滤算法推荐效果的重要因素。现有的协同过滤算法中,将评论挖掘与协同过滤相融合的方法是缓解该问题的重要途径之一,其中使用主题模型进行评论挖掘的协同过滤算法由于能够发挥主题模型的数理统计特性和灵活的拓展性等优势而逐渐备受关注。但现有的这类算法没有充分考虑到用户评论的短文本特性与情感特性,利用主题模型得到的主题概率分布的准确性难以得到保证,成为了制约其推荐效果的重要因素。对评分矩阵进行预填充的方法也是现有的协同过滤算法中缓解数据稀疏问题的重要途径之一,但现有的算法在填充方法的合理性、适用性、准确性等方面均存在着不同程度的局限,难以有效提升推荐质量。为了缓解数据稀疏问题对现有的协同过滤算法推荐效果的影响,本文从评论挖掘和评分矩阵填充两个方面出发,提出一种基于用户评论和评分的协同过滤算法。首先,针对现有的协同过滤算法利用主题模型进行评论挖掘的局限性,提出在协同过滤算法中使用主题情感混合模型进行评论挖掘的方法,并利用评论挖掘获取到的用户情感-主题分布对现有的协同过滤算法的相似度计算方法进行了改进,有利于获取更加精确的相似度,提升推荐质量。其次,针对现有的协同过滤算法在评分矩阵填充方面的局限性,提出一种利用用户情感-主题分布与用户交互数据对评分矩阵进行填充的方法。其中用户交互数据是近几年随着电子商务网站的发展而诞生的新型数据,能够从一定程度上反映用户群体的意见,是非常有价值的数据资源。最后,本文根据算法的数据需求使用Python语言进行爬虫开发并爬取了京东网站上的商品数据,通过实验确定了相关参数的配置,并将本文提出的算法与现有的几种算法进行对比分析,实验证明本文算法可以有效提升推荐质量。本文的研究内容在现有研究的基础上进一步充实了个性化推荐的理论,为协同过滤推荐算法的研究提供了理论支持与科学依据。
其他文献
十八届三中全会以后,出台了全面深化改革的很多意见。当前,从中央层面和地方层面,整体都在推进国有企业改革。由于改革问题非常复杂,中央、国资委也做了很多有益的尝试。$$ 一是
报纸
铁路专用线在推进现代物流建设、提高运输效率中发挥着重要作用。为强化专用线调车安全风险防控,针对铁路专用线调车作业环境和作业行为存在的安全风险,从外部环境和内部管理
随着市场经济体制的逐步建立和完善,消费者的权益保护意识、能力日益增强,但在农村,当前假冒伪劣商品仍旧泛滥,农民消费权益屡屡受损。本文在分析了农村消费权益保护缺陷形成
目的 研究经口补充谷氨酰胺 (Gln)对创伤感染大鼠免疫组织抗氧化能力及死亡率的影响。方法 采用闭合性创伤大鼠模型及补充或不补充 Gln两种方法 ,于伤后第 7d静注活绿脓杆
共享领导作为一种由知识经济和互联网经济孕育而成的新兴领导方式,一定程度上打破了垂直领导下的组织封闭的局面,并逐渐为不同行业、领域和市场主体所认知和应用。运用共享领
OADM(光分插复用)节点在光网络中的应用,实现了本地网的透明性,而且可以使光信号透明地传输和上下光波长,为提供端到端的波长业务奠定基础。本文概述了分插复用的技术原理、关键技
本文分析了水文地质勘察工作中的问题,并针对这些问题制定了解决方案。
目的:观察乌梅丸加味治疗脂肪肝的临床观察。方法:对30例脂肪肝患者运用乌梅丸加味治疗,每日1剂,水煎服,2个月为1疗程,2~3个疗程观察疗效。结果:治愈3例,显效24例,无效3例,总
建筑工程行业,由于工程成本高、资金用量大、周期长,整个项目和项目中各个阶段的工程造价工作就显得十分重要,在实际工程运行中,需要对工程造价进行严谨的分析和研究,同时根
膜分离技术是一项新兴的高效、快速、节能的新型分离技术。作为一种新型分离技术,在多种领域得到了广泛的应用。综述了反渗透、电渗析、纳滤、微滤、超滤、气体分离、渗透汽