基于评论与评分的协同过滤算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jhyyxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤是目前最为常用且最为成功的推荐技术之一,已被成功运用于许多在线应用中,但传统协同过滤算法中存在数据稀疏性问题,当用户评分数据稀少或缺失时,将难以做出准确的评分预测与物品推荐。近年来关于评论分析及文本挖掘的研究工作越来越受到研究人员的关注,与评分数据相比,评论文本往往包含了更加丰富且有价值的信息资源。针对传统协同过滤算法中的数据稀疏性问题,本文从用户评论文本入手,通过结合用户评分与评论的特点,提出了基于评论与评分的User-based协同过滤算法和基于评论与评分的Item-based协同过滤算法。本文主要工作如下:(1)介绍了本文的研究背景及推荐技术的发展情况,对当前主要的几种推荐算法进行了分析研究,并简单阐述了关于推荐系统的评测方法。(2)研究分析了用户评论文本的特点、组成元素,并介绍了用于文本主题挖掘的LDA模型,同时详细介绍了基于用户的协同过滤算法与基于物品的协同过滤算法。接着提出了评论主题分布、评论态度、改进的用户偏好、改进的物品特征等概念。(3)结合用户评论文本与用户评分的特点,利用传统协同过滤算法的基本思想,提出了基于评论与评分的User-based协同过滤算法以及基于评论与评分的Item-based协同过滤算法。算法利用评论文本产生评论主题分布,利用评分数据生成评论态度,结合评论主题与评论态度来建立更为准确的用户偏好模型与物品特征模型,进而进行评分预测与物品推荐。(4)在Amazon电子设备评论数据集上对本文提出的算法进行了验证,并与其它现有算法进行了对比分析。实验结果表明,相比传统的协同过滤算法和其它现有的基于评论主题分析的算法,本文提出的算法能有效提高评分预测的精度,提高推荐质量,同时在一定程度上缓解了数据稀疏性问题。
其他文献
惠而浦“鲜境”系列冰箱亮相中国市场2009年6月8日,全球最大的白色家电制造商惠而浦公司首次携包括全进口对开门冰箱在内的“鲜境”全系列冰箱产品在沪亮相,同时也预示着惠而浦
我国农业银行向国有商业银行转轨的正确方略选择是特色经营、现代管理、稳健发展。农业银行要在经营范围、内容、方式、手段和管理上围绕新“三农”有所创新 ;在组织体系、业
面对新形势、新任务,思想政治工作在继承和发扬优良传统的基础上,必须在内容、形式、方法、手段等方面进行创新和改进。本文结合农业科研基层单位的特点,探讨了职工思想政治工作
寝室文化作为校园文化的重要组成部分,对学生的成长有重要的意义。舒适宜人的寝室环境、积极向上的寝室氛围有利于学生的健康成长。加强寝室文化建设,能够有效帮助学生坚定理
实施农村土地承包经营权退出制度改革,是深入实施乡村振兴战略,推进农村土地制度改革的重要一环。近年来的农村土地承包经营权制度改革在退地方式、资格确认、退地确权、资金
结合数据仓库和数据挖掘技术等相关知识,通过实际的案例运用,简单介绍了基于Fine Report的数据分析和数据挖掘技术实现方法。
随着我国创新驱动发展战略的确立和实施,培养创新型人才成为我国教育的重要目标,提高大学生创新能力也受到各界广泛的关注。课堂教学是培养学生创新能力的关键,针对现如今大