小样本数据下电商产品销量预测研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:eg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
准确预测电商产品销量对提高企业进货、发货速度,优化企业产品库存,降低电商供应链运营成本具有重要意义。由于电商产品交易周期短、时效性强,因此销量预测具有明显的小样本数据特征。传统的销量预测方法例如:时间序列、决策树等因样本数据局限,容易出现过拟合问题,进而导致预测效果相对较差。本文将针对小样本数据下的电商产品销量预测问题,系统构建影响电商产品销量的多维因素,在此基础上引入机器学习方法,构建小样本数据下电商产品销量预测模型,并尝试对新产品销量预测开展模型迁移研究。主要研究内容及结论如下:  (1)影响电商产品销量的多维指标体系构建。首先,综合考虑企业内部产品库存及采购等信息、产品用户搜索行为、电商产品用户评论等多维因素对产品销量的影响,构建指标体系。其中:重点针对产品评论信息,构建双向LSTM情感分析模型,计算评论情感指数。其次,为降低同类指标间的相关性,将13个原始指标划分为5大类,包括:网络搜索、页面访问、企业内部库存及采购、评论质量、评论情感指数,针对同类指标进行熵值融合,为后续销量预测提供指标基础。  (2)基于集成学习Xgboost的电商产品销量预测模型构建及检验。在小样本数据下,构建基于集成学习Xgboost的电商产品销量预测模型,其中重点利用logistic函数和正则修正项确定目标函数,并利用贪心算法确定每颗预测树的预测层数。通过对A公司ZUK Z2产品数据进行模型检验,并与传统的BP神经网络预测、支持向量机预测、BP-SVM组合预测等方法进行对比,得出Xgboost预测精度最高。  (3)基于样本迁移的电商产品销量预测模型研究。针对小样本数据下的特例,即历史数据匮乏的新产品,构建基于样本迁移的电商产品销量预测模型。参考产品上市周期选择同系列产品作为候选产品集,根据新产品与候选集产品的性能特征确定源域产品。利用最小二乘法和遗传算法对新产品销量向量与源域产品销量向量进行模式匹配,测算优化的模式长度和个数,进而进行电商产品销量预测。以A公司ThinkPad New S2为源域产品针对S3新产品做模型检验,通过销量预测误差证明模型的预测精度可接受。  本文重点构建了影响电商产品销量的多维指标体系,将文本挖掘与集成学习方法结合,解决小样本数据下电商产品销量预测问题。同时针对小样本且指标数据缺失情况下的新产品销量预测,构建迁移学习模型。该研究为电商产品销量预测提供了思路,为电商企业需求决策提供了参考。
其他文献
该文以完善中国风险投资体系为研究目的.在深入分析风险投资理论和吸取国外发展风险投资业的经验与教训的基础上,重点结合中国国情,对国内的风险投资体系进行了研究.首先界定
城市管理信息化是发展的必然趋势.建立城市道路路面管理系统,可实现对城市道路进行信息化管理,可随时查询道路的各种信息,及时掌握道路的有关情况;城市道路路面管理系统借助
毫不放松地加强和改善党的领导,全面推进党的建设新的伟大工程,是党的十六大提出的一项战略任务。在新世纪的征途上,以“三个代表”重要思想统领党的建设,对于永葆党的先进
养老保险问题是当今社会保障领域研究的难点和热点之一.它对于改革后的中国经济尤为重要.养老保险精算理论是保险精算学的重要组成部分,主要研究养老保险缴费与养老金支付的
该文在西方国家关于政府再造理论的基础上,借鉴西方国家海关现代化的最新理论和成功经验,提出了中国海关再造的一些新概念和新思路,提出了建立企业型海关的战略构想.作者认为
高新技术产业化问题正成为当前社会领域中最为热点的研究问题。本文就是在这样的背景下来研究辽宁的高新技术产业化发展问题,通过对国内外高新技术产业化发展状况的比较以及辽
在对山东省高校原版外刊调研的基础上,对该省获取原版外刊信息的能力和水平、落后的原因、共建共享停步不前的原因,进行了分析、研究,并提出了建议.
2000年,大型国有企业——中国石油大连石化公司经过重组改制,在管理体制和运行机制等方面发生了历史性的重大变革,并迎来了重新打造国际竞争力的历史性发展机遇.但是经过系统
从交通枢纽,到会展中心,再到商务核心区……越来越多的内涵加之于大虹桥,在虹桥商务区缓缓掀开的蓝图上,书写着怎样的光荣与梦想?
现阶段,随着我国科技水平的不断提升,在很大程度上促进着自动化技术的发展与应用.自动化技术在机械设计中的应用,极大的提升了机械设计效率及质量,促进了机械设计生产制造的