基于改进k-means和卷积神经网络的新闻推荐系统

来源 :阜阳师范大学 | 被引量 : 1次 | 上传用户:vincent1115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网+已经成为时代发展的主要趋势,在快节奏的当下生活中,如何筛选海量的数据信息,成为当今信息技术领域急需解决的重要科研问题。为了解决这一问题,新闻推荐系统应运而生,本文开发基于改进K-means和卷积神经网络的新闻推荐系统,分别采用基于改进K-means机器学习技术和基于卷积神经网络的深度学习技术,对用户的兴趣进行建模,对新闻的特征进行捕捉,再基于协同过滤的推荐算法对用户进行推荐,可以更加精准的捕捉用户感兴趣的新闻,增加用户体验的同时,提升系统的性能。在基于改进的K-means新闻推荐模型的研究上,考虑对于中文新闻进行推荐。无论是传统的文本表示模型还是新兴的中文表示模型对于中文文本无法很好的表示,基于TF-IDF和K-means的文本表示模型缺陷在于,K-means聚类分析采用的是随机初始化簇中心的算法,让最终的新闻文本模型差强人意。于是在进行K-means文本处理前先对采用TF-IDF计算得到的文本特征向量进行SVD矩阵分解,在数学意义上对文本特征向量进行降维处理,降低空间稀疏性,从物理意义上也是对文本数据进行粗糙分类,再把分类结果作为K-means算法的初始簇中心,提升文本聚类的准确性。再对用户浏览的新闻历史记录进行用户-文本类别偏好建模,对模型采用基于协同过滤的新闻推荐。在基于卷积神经网络的新闻推荐模型的研究上,考虑对于英文新闻进行推荐,把微软MIND新闻数据集的标题作为文本输入,对文本采用Word2vec构建词向量模型,再把每个标题中的词转化为词向量的形式的数据,传送到卷积神经网络CNN模型的输入层,经过卷积、池化、全连接、Soft Max进行分类得到文本的分类结果,再通过对用户浏览的不同类别新闻历史进行建模,构建用户-新闻偏好矩阵,采用协同过滤推荐技术,最终推荐TOP-N新闻序列给用户。在个性化新闻系统实现方面,采用与前台完全分离的架构进行实现,后端则采用Python的Django架构进行算法的设计,而前台采用vue.js进行页面展示,采用My SQL进行数据管理。实现了用户登录权限认证,标签展示,为你推荐,以及热度榜,相似推荐,后台管理等功能。在此系统中,用户可以根据标签去选择感兴趣的新闻,也可以通过热度榜去关注当下火热的数据顶流内容,也可以根据个人偏好选择“为你推荐”的感兴趣的新闻,也可以在文章右侧点击“相似推荐”推荐文章相关的更多新闻数据,推荐方式多样,既能处理用户冷启动难题,推荐标签新闻及即时的热门新闻,也能捕捉用户感兴趣的新闻,使用户有较高的使用体验。
其他文献
人机对话是数代计算机与人工智能领域研究者和从业者为之努力和奋斗的方向,对话系统通常分为闲聊型对话系统、常见问题解答型对话系统和任务型对话系统,本文主要围绕任务型对话系统展开工作。任务型对话系统在实现方式上有端到端和管道式两种,管道式的对话系统通常由对话状态追踪模块、策略学习模块和回复生成模块组成。目前任务型对话系统在与用户进行多轮交互时,往往会存在意图和槽位识别困难、无法准确向用户传达信息的情况,
学位
双目立体视觉的核心任务是计算双目图像对应匹配点之间的像素视差进而获得深度信息,具有配置简单、精度高的优点,因此在自动驾驶、虚拟现实和智能机器人等领域有着广阔的应用前景。目前基于卷积神经网络的端到端双目立体匹配算法成为了双目立体视觉研究的热点,但是大多算法难以做到精度和速度上的权衡,限制了算法的应用,特别是阻碍了在精度和速度要求较高场景的应用,针对这个问题,本文对基于卷积神经网络的端到端双目立体匹配
学位
Extended表面活性剂是指在亲水基和疏水基之间嵌入中等极性的聚氧丙烯醚(PO)基团的两亲性分子,其灵感来自在增溶体系中加入短链醇作为助剂来延长碳链,使表面活性剂的碳链得以进一步延伸至油相中,增强增溶性能,Extended表面活性剂将这种优势在不影响其水溶性的情况下结合在分子内,该类表面活性剂典型特点是:易于降低界面张力、微乳液增溶能力强,在三次采油、土壤修复、植物油萃取等领域具有广泛的应用前景
学位
随着现代医疗技术的发展,人体器官移植技术在治疗人体器官衰竭等重大疾病方面起着重要作用,但它对人体的干预也超出了我们的想象。人体器官移植技术引发的伦理问题一直是学术界研究的热点,但以往的研究大多是把人体器官移植技术分解为器官的摘取、分配、植入等一系列医疗活动,而从人体器官移植技术这一技术本身角度来研究伦理问题的文献较少。本文从人体器官移植技术应遵循的伦理原则——尊重生命原则、不伤害原则、公正原则及效
学位
近年来,党和政府极其重视农民工欠薪问题治理,先后制定了多项法规政策,但形势依然不容乐观。治理拖欠农民工工资问题,是保障农民工劳动权益的重要举措,直接关系到社会和谐稳定。因此,如何有效治理农民工欠薪,如何维护农民工劳动权益成为了各级政府亟待解决的重要公共管理问题。本文以Z市为例,力图基于协同共治视角探究农民工欠薪问题治理的具体路径。本文首先阐述了研究所涉及的概念和理论,为本次研究奠定了理论基础;其次
学位
目的:胶质瘤是最致命的肿瘤之一,我国胶质瘤年发病率为5-8人/10万,且呈逐年上升趋势,五年病死率仅次于胰腺癌和肺癌。胶质瘤的治疗手段选择性有限,往往疗效不理想,易复发,所以寻找新的生物标志物,探索潜在的治疗靶点具有重要意义。真核翻译起始因子(Eukaryotic translation initiation factors,eIFs)在蛋白质合成的各阶段发挥重要作用,目前已知的eIFs家族包含e
学位
当今中国人口老龄化与数字化社会两大进程交融发展,许多人在享受数字化带来的便利之时,老年人由于诸多主客观条件限制,面临日益严峻的数字融入困境,难以平等享受数字社会发展的红利,这给国家积极老龄化事业带来严重挑战。基于上述背景,本文以C市B社区为研究地点,通过实证调查了解老年群体的数字融入现状,发现许多老年人存在数字融入信心不足、数字技能水平低、媒介素养水平低,出现难以平等享受数字化服务的数字融入困境。
学位
《义务教育语文课程标准年版(2011年版)》中提出要正确的应用语言文字、具备生活需要的写作能力和口语交际能力。语言是展现自我、与他人交流、创造新事物的“动力”,语言表达能力是个体发展不可缺少的技能之一。目前中小学对学生语言表达能力的培养方法比较单一,没有找到合适的技术解决方案。传统教学组织形式脱离情境,方法趋于同化输入、共性化输出,注重答案对错的分数导向而忽略学生的异性表达,久而久之学生表达欲降低
学位
中国共产党具有的独特品质之一就是勇于革命,1921到2021,回望百年来中国共产党的建党历程,雨雪风霜、大浪淘沙,经历各种磨难而生生不息,面对所有困难逐一克服,这当中的决定性因素就是始终坚持从严治党,并且坚持自我革命。系统对中国共产党展开自我革命的进程进行梳理,对自我革命的相关内容、经验、内涵和价值进行探索,对长期执政能力的提升与取得人们的信任度和认同感有着重要的意义,党建工作与社会执政的进程有许
学位
在我国“双碳”能源战略背景下,政府出台相关政策大力扶持电动汽车(Electric Vehicle,EV)产业的发展,电动汽车规模与日俱增。然而大规模电动汽车无序充电会对电网造成诸多影响,如降低电能质量、影响电力系统运行的经济性和稳定性等。而电动汽车作为一种灵活性的储能资源,通过合理有效的充放电优化策略对电动汽车的充放电行为进行有序调控,可以充分发挥大规模电动汽车灵活性储能资源的潜力,改善电网负荷分
学位