基于LSTM-XGBoost的电商商品短期销量预测

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:cnyy20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电商行业的不断发展,电商企业商品的种类和交易额不断增加,但相应的资产评估模型没有随之配套发展,中小型店铺面临融资难、库存成本高等问题,电商商品短期的销量预测非但能对企业或个人经营者在货品库存的补货计划里起协助作用,且根据预测的结果作出适宜的库存决策可以有效地降低货品的库存成本。然而由于电商商品销量波动具有变异幅度大、不同商品变动异质性等性质,电商交易下的销量异动所受影响因素繁众,这些特征给短期销售量的预测增加了难度,使其成为对电商企业销售研究的难点之一。本文将电商商品短期销量的预测作为研究内容,首先对国内外学者关于电商销量预测模型和技术改进等方面进行学习,提出一种基于LSTM神经网络和XGBoost的组合预测模型以来自于阿里巴巴的生意参谋网站上的真实商品销售数据作为案例进行验证和分析,主要包括:首先对已有的电商销量的预测技术方法以及优化的循环神经网络LSTM、集成算法XGBoost模型的应用进行归纳总结,得出从研究技术上常分为单变量预测法、多变量预测法以及组合预测法实现对销量短期的预测,从销量基于不同的影响因素方面可以使用历史销量和外部影响因素实现对销量的预测,该方面的研究比较少,具体的影响因素还是需要从某个角度切入。其次,通过探究预测电商商品短期销量存在的销量波动幅度大、影响因素繁众以及不同商品销量变动的异质性等问题,从电商交易环节来剖析每个阶段所包含的消费者行为,并以消费者的角度进行潜在订单——下单——支付以及订单完结的流程,得到从浏览、加购、收藏、下单、支付、售后服务等六个板块,确定可能的影响因素,对所有电商商品做不同的聚类处理,选择最优的聚类结果再对不同类别的商品做相同的建模预测,以避免全样本预测带来模型构建的困难,同时佐证了构建的组合模型比单一的LSTM、XGBoost模型具有性质更优的预测效果。最后,对各类别的电商商品分别采用单一模型LSTM、XGBoost的预测,在每个单模型里分别采用历史销量的纯时间序列预测和引入交易环节影响因素的预测,利用LSTM深度神经网络对历史销量和影响因素进行特征提取,提取后的神经元再与原始数据的影响因素等作为XGBoost的输入,生成LSTMXGBoost的组合模型,实验证明对每一类电商商品引入影响因素的LSTM-XGBoost组合模型比纯历史销量的单一LSTM和XGBoost模型预测精度高。
其他文献
中国在最近的四十年里创造了经济快速发展的奇迹,令世界瞩目,但与此同时带来的是资源日益枯竭、环境严重污染等问题。为了实现经济与环境共同发展,我国必须实现经济发展模式的转变,为了建设生态文明的国家,我们应当在保证经济增长的同时,降低我国的能源消耗,这要求我们提升我国的能源效率。此外,我国地势多样、幅员辽阔,不同地区之间在经济发展、地理环境等方面存在着巨大的差异。因此,在提升我国的能源效率时,我们需要具
学位
新冠肺炎疫情是百年一遇的健康危机,导致大量人口不幸感染、罹难,造成了严重的经济破坏。虽然现阶段我国新冠肺炎疫情已基本得到控制,但疫情对经济与房地产市场的冲击已经产生,并仍在持续影响人们的生活,且疫情的局部性反复与散点式爆发一直在冲击影响着房地产市场的稳定。本文基于从链家网爬取的武汉市微观房产交易数据,使用因果推断和事件效应评估中常用的合成控制法(SCM)和双重差分法(DID),从微观视角评估了20
学位
贫困是全球共同面临的困难,也是伴随着社会经济发展一直存在的问题,我国在2020年底完成了消除绝对贫困的艰巨任务,因此贫困的性质和特点也发生了相应的变化。我国贫困问题已由原来绝对贫困的研究转向现在对相对贫困的探讨,从单一收入维度识别贫困群体转为从多维度视角综合评价。农村地区依然是贫困的主要发生地区,虽然绝对贫困已消除,但是却存在更加复杂更难解决的贫困问题,因此本文基于农村地区进行贫困问题研究。同时,
学位
金融市场的变化莫测,人们很难完全知晓其中的特征波动规律,因此通过分析高频金融数据反映市场波动的特征规律是十分准确和有必要的。高频金融数据是指在开盘期间进行高频抽样所计算得到的金融交易数据,高频金融数据的研究能够更为细致和全面的准确反映和计算出当前各种金融产品在金融市场上的波动,通过高频金融数据的波动分析,能够更好的帮助于人们更准确的规避当前各种金融产品的波动对于投资者收益所带来的影响和风险,有利于
学位
数字经济的发展将成为经济高质量发展的重要增长点,为全球经济发展注入新的活力。自2017年以来,党和国家对数字经济的发展给予了充分重视,各地数字经济发展水平的提高也取得了显著成效,但数字经济仍存在非均衡发展问题。因此,关注我国数字经济发展时空特征,探索影响数字经济发展水平的因素,对于缩小我国地区数字鸿沟及促进数字经济发展具有极其重要的现实意义。本文以2015-2019年我国31个省级行政区的数字经济
学位
自2013年Aileen Lee首提“独角兽”概念,到2014年2月习近平总书记在关于网络安全的会议上讲到,“我国正处在信息化和经济全球化相互促进的浪潮中”,但是存在“自主创新方面相对落后”的问题,2015年李克强总理在《政府工作报告》中制订“互联网+”行动计划,再至2018年,科技部正式规范“独角兽企业”的判定标准。短短六七年的时间,我国独角兽企业获得了跃升式的发展,企业规模和数量都大幅提升,企
学位
现阶段,我国正处于关键的经济转型阶段。2015年11月,习近平总书记提出的“供给侧改革”是经济转型概念中的核心内容;中共十八届六中全会提出“实施稳定的宏观政策”、“积极推进科技创新”等建议;2017年3月5日,习总书记在参加十二届全国人大五次会议时再一次提到创新的重要性。可见,在如今创新能力是一个国家的核心竞争力的时代背景下,促进企业创新能力发展刻不容缓。然而创新活动对于企业来说是一项具有正外部性
学位
在众多金融研究话题中,汇率问题的热度一直高居不下。在经济社会生活中,汇率一头牵着国家的宏观调控和经济政策,另一头和国际经济稳定相挂钩。人民币国际化速度的逐步加快也进一步增加了人民币汇率的波动频率和幅度。而国际贸易和金融投资自然受到汇率波动性影响,如果其过大,在投资时风险也相应大。准确预测汇率波动性,把握汇率高波动率区间,是防范贸易、投资等领域风险的重要方式。美国作为世界最大经济体,自然不可忽视地位
学位
近年来,职场欺凌作为职场中一种频发的负面现象,逐渐受到了外界的关注。国际劳动组织在2006年的调查中证实职场欺凌已成为一种日益严重的职场暴力。民营企业作为近年来蓬勃发展的组织形式,其内部不完善的规章制度成为了滋生职场欺凌的温床,新员工则由于自身特质与经验缺乏等条件限制,成为了遭受职场欺凌暴力的重灾区。目前针对于新员工受职场欺凌后的心理疏导调节仍未引起足够的重视,社会工作学界对其仍缺乏关注。基于此,
学位
随着人民物质文化水平的不断提升,乘坐飞机出行的需求在不断增加。我国航空市场并不是垄断局面,面对这块大蛋糕,各航空公司要想生存发展的最大命脉就是争取客源。本次论文的主要目的就是期望从航空公司感兴趣的两个主题——客户分层和流失预测,通过数据建模,根据数据挖掘结果定制客户的个性化产品服务进而提升航空客运上座率。全文研究的主体内容共分为以下部分:首先,主要是引论部分,主要对客户分层和流失预测研究的背景及意
学位