论文部分内容阅读
随着经济社会的快速发展,人们在追求高品质、多样化农产品的同时也在寻求更加便捷的购买途径。农产品线上交易的兴起与发展,满足了人们便捷高效的农产品购买体验,同时也为农产品的生产者与消费者之间建立了一条新的交互渠道。在以数据驱动发展的背景之下,信息的价值不仅仅局限于其获取渠道,更重要的是从中提取有价值的、新颖的、可理解的知识,为国家政策的制定、企业战略的实施与个人生活的改善提供科学的决策建议。线上农产品交易发展的目标在于彻底解决供需信息失衡,最终实现线上需求与线下生产的合理分配。这一目标的实现离不开通过对线上农产品交易时产生的数据进行处理,准确掌握线上农产品销量变化特点和变化趋势,因此对线上农产品销量的精确预测成为当前线上农产品交易信息处理的工作重点。随着线上涉农产品交易数据规模的激增,传统浅层模型的预测性能已无法满足当前线上交易数据的处理需求,深度学习理论作为模式识别和机器学习领域最新的研究成果,以强大的模型构建和特征表示能力在图像和语音处理等技术领域的大规模数据处理能力方面有卓越的表现。本研究从农产品线上交易原始历史数据出发,以影响农产品线上销量的九大因素为基础建立评价指标,将销量分成四个等级。首先,采用深度学习(Deep learning)算法的自动编码器(Autoencoder)方法提出一种基于深度学习的线上农产品销量预测模型-皇冠模型(Imperial Crown Model,简称ICM),该模型采用两层自编码网络提取样本特征生成新的特征向量;利用带标签样本集训练分类器并对无标签训练样本分类;利用BP微调整个网络参数得到使损失函数值达到最小的最优参数,实现线上农产品销量的动态分类预测。其次,针对交易数据具有快速、多样化增长特点及销量影响因素与销量等级间的模糊对应关系,采用基于模糊隶属度的数据预处理技术优化深度学习算法,加入具有稀疏性限制的自编码方法,提出了一种带有模糊隶属度的深度学习销量预测模型-超皇冠模型(Super Imperial Crown Model,简称SICM)。该模型在使用模糊隶属度处理销量影响因素与销量等级间权值关系的基础上,使用稀疏自编码(Sparse Autoencoder)网络自适应提取样本特征;销量等级分类预测采用Softmax分类器;采用BP微调以达到参数最优化。最后,利用收集到的交易数据应用R软件对两个模型进行仿真并对比分析两大模型的综合预测性能。结果表明,本文研究方法针对当前线上农产品交易数据特点能够实现实时、准确的动态销量分类预测,有效克服因信息失衡引起的供需不平衡现状,并且对深度学习在电子商务交易领域的研究有促进作用。