论文部分内容阅读
随着我国葡萄酒行业的发展,传统方式的葡萄酒企业信息管理模式已经无法满足企业的需求,针对大数据量葡萄酒信息数据的处理,以及企业信息资源管理水平和工作效率的提高,本文设计实现了基于分布式的葡萄酒信息分析系统。该系统高效的实现了葡萄酒信息的整合以及信息管理的规范化和标准化,提高了企业对人员和葡萄酒相关信息管理的工作效率。本系统以葡萄酒行业、数据挖掘和大数据云计算技术为背景,设计实现了基于分布式的葡萄酒信息分析系统。该系统主要包括七个功能模块:前台信息展示模块、首页欢迎模块、数据管理模块、信息管理模块、预测分析模块、用户管理模块和数据信息可视化分析模块。前台信息展示模块主要负责向用户展示酒庄的葡萄酒产品、招聘信息和联系方式等信息;首页欢迎模块负责展示系统的概要信息,如酒庄附近的天气状况、当前时间、酒庄地图、销售信息、销售区域、葡萄酒库存量以及用户信息等;数据管理模块主要负责葡萄酒数据的导入和导出系统;信息管理模块主要负责对酒庄天气信息、酒庄环境信息、葡萄酒成分信息、葡萄酒信息、库存信息、出入库信息以及销售信息进行管理;信息预测分析模块主要负责对酒庄48小时内天气状况、热词搜索度以及葡萄酒等级质量的进行预测分析,其中对葡萄酒等级质量的预测分析是以机器学习算法为理论支持,使用基于分布式的hadoop技术进行预测分析;用户管理模块主要负责对系统会员信息的管理和角色权限的分配;数据可视化展示模块主要负责对系统中管理的数据信息以可视化的方式友好的展示给用户。本文研究的主要工作如下:1、主要技术方案。在对葡萄酒等级质量预测分析模块,本系统采用了基于分布式的hadoop技术的数据处理方式,数据的预处理采用了 ETL数据仓库技术,数据的可视化使用了 Echarts技术,数据的异步请求处理使用了 Ajax技术。2、系统设计实现。本研究以windows和Iinux为开发平台,以开源的JAVA为开发语言,以eclipse3.8为开发工具,以开源的关系型MySql为数据库,基于分布式的hadoop技术和Java Web技术自主设计开发了葡萄酒信息分析系统。3、本文针对葡萄酒数据等级质量预测分析问题,研究了支持向量机(SVM)算法、朴素贝叶斯算法、BP神经网络和深度学习算法。实验过程中,采用UCI实验室提供的白葡萄酒和红葡萄酒数据集作为训练样本,分别利用以上机器学习算法对葡萄酒等级质量进行预测分析对比,根据实验结果,选择设计实现了基于hadoop的并行SVM算法。实验表明,并行化的SVM在对大数据量样本进行训练预测时,效率上具有明显的提高,并且预测准确率不会明显的降低。