个性化新闻推荐系统的研究与设计

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:ping996115122xing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化新闻推荐系统是根据每个登录过推荐系统的用户的历史行为,使用推荐算法为每个用户推荐其感兴趣的新闻。基于协同过滤算法的个性化新闻推荐算法是根据用户的历史行为计算新闻的相似度,并完成相似新闻的推荐。这种相似度的计算方法没有挖掘新闻本身的特点,存在数据稀疏的问题。同时,协同过滤算法没有考虑用户的兴趣随时间发生动态变化的问题。针对推荐算法新闻相似度计算存在数据稀疏问题,本文着重研究了国内外文本相似度的计算方法,提出了适合新闻特点的混合相似度计算方法。改进的相似度计算方法是在现有的相似度计算方法的基础上,考虑了新闻文本中不同词性的词语重要性不同、新闻标题中的词语重要高于新闻正文中的词语这两个特点,并融合了基于用户行为的相似度计算方式,最后将改进的新闻相似度计算方式用于新闻推荐算法中。针对协同过滤算法没有考虑用户兴趣变化的问题,本文着重研究了国内外现有个性化新闻推荐算法,提出了适应用户兴趣变化的个性化新闻推荐算法。一般来说,用户近期浏览的新闻对用户的兴趣模型贡献较大,但用户兴趣具有反复性的特点,即早期的兴趣也有可能对用户有影响。因此,在协同过滤算法的基础上,建立了用户的近期兴趣模型和基于行为反复的兴趣模型,融合得到用户稳定的兴趣模型,并用于推荐算法中。论文中的数据集采用的是DataCastle的财新网阅读记录,评测指标是F-measure值和平均绝对误差值。适合新闻特点的混合相似度计算方法与现有的相似度计算方法都用于推荐算法进行对比,推荐结果显示,改进后的相似度计算方法的推荐结果的Fmeasure值比其他的算法最大高出10.5%,这说明了改进后的算法能更精确地计算新闻相似度值,有效避免了数据稀疏问题;适应用户兴趣变化的个性化新闻推荐算法的F-measure值与传统的协同过滤算法、现有的推荐算法最大高出11.5%,平均绝对误差值最高下降了8%,这说明了改进后的算法能更好地反映用户的兴趣。论文最后完成了个性化新闻推荐系统的设计与实现。通过对个性化新闻推荐系统进行总体分析和需求设计,并将改进的推荐算法应用于系统设计中,最终完成了整个新闻推荐系统。
其他文献
在构建包含停车换乘(P&R:park and ride)接驳方式的出行方式选择NL(nested logit)模型的基础上,分析了停车票价对P&R出行比例的影响,建立了停车费用与P&R停车设施使用人数间
大学生思想政治理论课是我国文化传承的先锋,是高校思想政治理论课的重要组成部分。本文分析当前高校思想政治理论课教学现状及评价系统,并针对不足之处提出相应的对策建议,
本文针对齿轮失效破坏的特征,较为详细地分析、研究了水泥工业设备齿轮润滑在设备管理中的重要性.为提高水泥生产线的运转率,延长设备使用寿命,提出了改善齿轮润滑的优化方案
越权原则是英国行政法的基本原则,曾在司法审查中对行政机关的控制和监督方面发挥着十分重要的作用。但近年来随着英国行政法的迅速发展,越权原则表现出不少缺陷,一些学者和法官
为有效解决传统简历解析方法效率低、成本高、泛化能力差的问题,提出一种基于字序列的非结构化文本简历解析方法。利用BLSTM对字序列进行建模,获得一个包含字序列信息的词表
色阶重建技术已应用于高动态范围图像的处理中。应用色调映射技术和局部亮度适应性原理,提出了彩色图像增强的算法来改善彩色图像的可视性。使用一个参数自适应的可变基的对
主要针对黑盒测试存在的问题,提出一种测试用例设计方法:根据系统规格说明和系统输入输出之间的关系等附加信息,来确定输入参数之间的覆盖和约束关系,并对参数输入域进行约减
在我国对眼科专科医师的培训正处于试点阶段,有诸多方面待进一步探讨完善,德国眼科专科医师培训已有一百多年的历史,有着稳定的培训体系和制度。文章旨在介绍其培训模式和特
<正>近年来,我国高血压患病率呈增长态势,且多随年龄增长而升高,高龄逐渐成为高血压发病的重要危险因素。研究显示老年高血压导致的肾损害及终末期肾病(ESRD)患者逐年增加。
针对HXN5型机车齿轮箱在运行过程中箱体内存在复杂的油气二相流问题,建立三维物理模型,基于mixture多相流模型,应用动网格及并行计算技术对齿轮箱内的油气二相流进行动态数值模