改进K-means算法对大兴安岭蓝莓干销售预测的应用

来源 :东北林业大学 | 被引量 : 3次 | 上传用户:yingzhao1121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今信息时代,每时每刻产生于商业领域的销售数据都以爆炸式的方式增长,人们更关心的是如何从庞大数据量中汲取对未来销售有指导意义的信息,避免“菜贱伤农,菜贵伤民”的尴尬局面,所以对销售数据进行数据挖掘并预测成为了新的挑战。要想突破这一瓶颈,数据挖掘的聚类技术和预测模型为研究人员提供了解决方案。传统K-means算法在解决聚类问题上应用广泛,以其聚集程度高、操作性强的特点在数据挖掘的聚类分析中具有明显优势。然而传统K-means算法由于缺乏对噪音点的判定,以及算法本身对孤立点过于敏感等缺陷,又使得在某些问题上受到局限。正如本文研究的预测销售量的问题,如果在数据梳理阶段没有将其高度聚类、没有充分体现分组后的数据特性,那么势必会影响最终预测的结果,造成误差范围外的偏差。为保证预测的准确,必须要确保数据样本集的精细处理。本文从算法改进研究和应用两方面,提出基于DBSCAN算法思想去噪的改进K-means算法,并将其应用在对大兴安岭当地五家公司的2005-2014年销售量的数据挖掘过程中,形成高度聚集的样本集,最后利用样本集数据作为预测模型的原始数据,预测销售量。本文的主要工作如下:(1)改进K-means算法,优化去噪过程。不再像传统K-means算法凭借人为经验和预先构想剔除噪音点。结合DBSCAN算法对噪音点判定的方法,对原始数据进行降噪处理,提高预处理数据的精细程度。(2)数据聚类。按销售量高、中、低三个层次对去除噪音点之后得到的数据集进行聚类处理。并将改进算法和未改进算法的聚类结果进行对比,分析聚类结果。(3)预测销售量。利用ARIMA预测模型对通过改进算法得到的聚类样本集进行预测,同时用同样的预测模型对未改进算法得到的聚类结果预测。分别将两种预测结果和当年实际销售量做比对,证明改进算法的可行性和优越性。(4)预测价格。根据2005年-2014年大兴安岭蓝莓干市场价格,用四种模型分别拟合,选择最贴近实际情况的走势,并对未来价格走势做出分析。实验证明,通过与实际销售量结果比对,优化去噪过程的改进K-means算法对噪音点的判定是合理的,用去噪后得到的样本集来聚类,能使类内具有更大的相似性,类间具有更大的差异性,真正达到了聚类的效果和目的。通过改进算法得到的聚类结果作为预测的样本集,使预测值更接近实际值,预测准确率明显高于未改进算法得到的结果。结合对价格走势的预测,在销售量和价格两方面讨论产销平衡的关系。
其他文献
目的探讨听力测试组合(ABR+ASSR+声场环境中的行为测听)在感音神经性聋患儿残余听力评估中的应用价值。方法48名(96耳)感音神经性聋患儿中能配合纯音测听的患儿19人(38耳)设为PTA组,进
将微藻和电去离子技术引入密闭生态系统,设计单元反应器旨在验证其在空气再生、水净化和潜在食物的生产。在反应器中对尿液进行消解和NH4+硝化转化得到超过90%NH4+-N硝化为NO-3
富锂层状正极材料x Li2MnO3·(1-x)LiMO2(0<x<1,M=Ni、Co、Ni0.5Mn0.5等)因其比容量较高、环境友好、价格低廉和安全性好等优点受到广泛关注。但这类材料具有首次不可逆容量损失
当前,中国正经历着人类历史上最大的城镇化进程。随着大量农村流动人口向城市转移,城乡二元结构带来的社会不公问题日益突出,化解社会矛盾、促进农民工的城市融入,成为今天城
在当前高校人才培养与企业人才需求不匹配的情况下,新员工的职业素养培养成为贯通当代青年发展全过程的重要环节。这就需要系统全面地研究新员工职业素养培养的规律,更好地促
本文通过对双绞线的工作环境和条件的分析计算,探讨了在当前高速网络条件下,对传输线缆的信噪比基本要求,并在此基础上,对屏蔽双绞线的常见屏蔽材料进行了分析计算,对不同要
由于ERP生产计划不准确,在供应链上企业的计划协同性方面也存在不足,因此,它已不能适应企业信息集成的需求。高级计划系统(APS:AdvancedPlanningandScheduling)通过复杂而有
人工流产术是终止非意愿妊娠的主要治疗手段。全球每年约有4000~6000万例人工流产,即全球妊娠的26%以流产结局。人工流产不同程度地威胁着女性的生殖健康及身心健康,并给家庭、社
<正>目的胃癌TNM分期是判断预后和指导治疗的重要指标之一。UICC和JGCA TNM分期历经数版修订,其合理性仍存争议。主要体现在:①2010年新UICC和JGCA pT分级将原pT2分级细分为p
会议
辣木籽2种提取液在不同条件下对水中4种重金属(Cu、Zn、Pb、Cd)离子去除效果的结果表明,辣木籽盐提液对去除水中的Cu、Zn、Pb、Cd离子有一定效果,最佳浓度为10倍盐提液,最适