基于ARIMA模型的用户兴趣预测研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:sst3562008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网飞速发展,随之而来的是信息量的激增,每天都会产生大量数据,而我们不可能一一浏览所有的信息,因此,如何才能充分利用这些数据,从中挖掘出用户可能比较关注的信息,生成一个有针对性的推荐,提供越来越多的高质量服务,开始引起许多学者的关注。对于个性化的推荐系统来说,其前提条件就是要对用户兴趣的有一个较为正确的把握。只有对用户画像精准,用户模型建立准确,才有可能提供好的推荐。但是,用户兴趣并不是始终不变的,有可能因为时间因素或者外部环境的变化,导致用户的兴趣也随之改变。如何建立用户兴趣模型以及如何充分利用历史信息对用户兴趣的变化趋势进行预测,这对于推荐系统来说是两个重要的研究方向。本文围绕以上两个方面展开研究。首先研究用户兴趣模型的建立。基于新浪微博的特征进行分类,使用python语言编写爬虫算法,爬取类别特征明显的微博数据集作为分类训练语料集,构建更贴近微博特征的分类体系。对各类别训练语料集进行主题分析。同时将新浪微博用户的微博内容数据、用户标签数据、个人介绍等这些能体现用户兴趣的信息进行合并,构建用户兴趣文档。使用User LDA模型从兴趣文档中提取兴趣主题,计算用户兴趣文档和各个类别的语料集的相似度,将其相似度作为用户对各个兴趣大类的兴趣度,建立用户兴趣模型。在确定了用户兴趣模型后,本文考虑到了用户兴趣可能会存在漂移这一现象,进一步展开了对用户兴趣预测的相关研究。时间信息在对用户兴趣预测中发挥至关重要的作用,本文通过将新浪微博2012-2014年内的用户数据按月进行划分,针对每月建立用户兴趣模型,构建用户兴趣的时间序列,在此基础上引入一种时间序列预测模型——ARIMA-LSTM模型对用户兴趣进行预测。通过ARIMA提取时间序列中的线性信息,LSTM神经网络进一步拟合ARIMA预测残差项中的的非线性信息。可以实现对兴趣的更精准的预测。实验结果表明,本文的方法能够深入挖掘用户兴趣序列中的线性特征和非线性特征,探究用户兴趣的动态演化趋势,对用户兴趣做出精准预测。本文基于预测结果进一步研究,将其应用到推荐上,对比未经改进的ARIMA预测推荐和指数平滑预测推荐也体现了一定的优势。
其他文献
表现性绘画语言的探索涉及范围、方向较为广范,作为艺术语言的表达方式,这种艺术语言形式用于绘画创作以展示艺术家的情绪,具有无限的可能性。本文尝试首先从表现性绘画语言的概念以及构成要素入手,从肌理材料、笔触笔法、色彩运用、造型这几个方面分析表现性绘画语言表达方式的多样性;其次,对艺术家韦拉斯科·维塔利(Velasco Vitali)油画风景作品进行分析,着重从笔触、肌理以及色彩等方面对其城市风景作品中
西湖文学经过了元明时期的复苏发展,到清朝一代,在朝局时代的稳定下衍生出强劲有力的发展势头,展现出以诗歌为主,词、曲、文赋、传奇、小说次之的多元繁荣发展趋势。其中,杭州诗人以得天独厚的地理位置和诗歌创作氛围浓郁的地域文化环境,对西湖进行了全方位、多方面的吟咏书写,在西湖文学史和西湖诗歌史中皆具有独特且重要的存在意义。本文拟以“杭郡诗辑”系列中所涉及的杭州诗人为主体,辅以《清代诗文集汇编》中的诗歌选集
随着中国经济整体持续稳定增长,各个行业逐渐发展成熟。与行业发展、企业运作最密切相关的供应链也日趋完善。很多企业在成长的过程中,逐渐与主要客户、供应商形成长期稳定的
风水理论在我国传承悠久,是宝贵的传统文化,其理论体系博大精深。《地理五诀》,作为风水理论体系中的一本是对唐宋以来历代的风水名著及其理论进行整理与发展的风水集成之作,编著于清代乾隆年间,为赵九峰所著。该书的特色是在于对风水理论核心的五诀进行了系统归纳,由唐至明所注重的龙、水为主,向为辅的三诀归纳为龙、砂、穴、水、向五个论诀,并将前四诀引至向诀为重心结尾。全书提高了向诀重要性的同时,也增强了风水中五诀
课文辅助系统作为历史教科书的重要组成部分,包含导入系统、阐释系统和巩固系统,这三个系统在历史教学中的作用不可或缺。导入系统开宗明义、提纲携领;阐释系统多种多样、图文并茂的表现形式,能帮助学生加深对课文内容的认识和理解;以课后习题形式出现的巩固系统有助于稳固学生对新知识的掌握程度。除此之外,课文辅助系统在培养学生的唯物史观、时空观念、史料实证、历史解释和家国情怀等历史学科核心素养方面也起着重要作用。
财产保险业作为社会经济发展的稳定器与助推器,对提高风险抵御能力、维持社会秩序、促进资本流通方面发挥着巨大作用。但是客户投诉率持续居高不下,不仅影响行业形象,而且对于保险市场的发展也存在不稳定风险。同时,各家保险公司也面临着客户的不信任,监管部门的严格要求,以及市场竞争压力的不断升级。客户投诉作为客户抱怨的最直接表达方式,补救措施是否得当,会对企业的声誉、口碑产生直接影响与深刻作用。特别是在当今万物
锂离子电池由于其能量密度高、循环性能好等优点而广泛应用于电动车和通讯领域,产量逐年提高,对日常生活具有重大的影响。达到使用寿命后被废弃的锂离子电池如果通过固化深埋或者存放于废矿井处理,其中含有的Ni、Co等有价金属和外壳等材料会造成巨大的资源浪费,有毒物质会造成严重的环境污染,因此,对于锂电池的各组成部分进行回收与再利用就尤其必要。因此,本课题对锂电池中的镍钴锰酸锂(简称为“三元”)正极材料的回收
地质聚合物是一种新型的绿色凝胶材料,以高硅铝质天然矿石或工业废弃物为原料,通过化学激发而形成的无机聚合材料。地质聚合物相比于传统硅酸盐材料而言,具有价格低廉、生产工艺简单、环保低能、耐久性好、耐腐蚀性好、力学性能好等优良特征。在生活中可应用的范围广泛,可用作房屋建筑材料和混凝土路面材料,防火阻燃材料、多孔材料等领域。地聚物的形成及其力学性受诸多条件的影响,如碱激发剂种类及浓度、原材料种类、养护条件
党的十八大中提出了“美丽中国”这一概念,之后不断地强调生态文明建设的重要性。国家领导人指出生态文明建设对于中华民族未来的发展是至关重要的,要在国家建设的各个方面和全过程融入生态文明这一理念。近年来我国也在法律层面对环境问题进行规制,以此助力生态中国、美丽中国的建设。1997年《刑法》中首次规定了“重大环境污染事故罪”,2011年出台的《刑法修正案(八)》以“污染环境罪”替换了原来的“重大环境污染事
为了考察褶皱高宽比、褶皱层数和褶皱偏移角度对玻璃纤维/环氧树脂基复合材料层合板拉伸性能的影响,参考ASTM D 3039开展了无损伤和含有不同类型褶皱缺陷的玻璃纤维复合材料