基于物联网的农业大数据处理方法研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:bldhdh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物联网在农业信息化中的推广,庞大的传感器和RFID节点,能够更好地对生产环境中的信息进行监控,但是,它们采集的数据量规模会越来越大,数据会出现海量冗余,会对我们后续的业务处理任务造成了一些影响,不仅有性能瓶颈等问题,还会导致输出结果不可信。如此巨大规模的数据,是传统的数据处理方法遇到的难题,而随着大数据时代的步伐,出现了很多大数据计算框架,如Hadoop、Storm、Spark,很多企业选择它们,并做出了成功的案例,它们也相继被应用在农业大数据领域。根据数据的特点和使用场景,选择合适的处理工具,是进行数据处理必须要考虑的因素。对高度冗余的数据如何做预处理,对大数据做处理分析的系统如何做到健壮高效,都是不可忽视的细节。本文依据实践经验,基于农业系统中数据的数据流向和数据特征,根据Spark处理分析数据时的机制,从减少数据冗余,并从做大表关联优化的问题入手,提出了基于BloomFilter的数据过中间件,提出了Spark大表关联优化方法。本文的主要研究工作如下:(1)基于物联网的农业数据采集端,采集的数据往往海量冗余,给后面的分析处理带来了一定问题,本文根据BloomFilter过滤数据的优点,在基于BloomFilter的基础上提出了对冗余数据进行过滤的优化方法。(2)针对Spark这个大数据计算框架能够进行流式数据处理,能够处理基于物联网的农业数据流并且符合实时性要求,但是面对很大的两表进行连接操作时通常表现的效率不高和面对数据倾斜时造成的问题,给出了一个优化方法。(3)将以上的优化方法运用于实际应用中。设计了一个基于Spark和农业物联网的系统模型,该模型中主要结合了上述1和2中优化方法,并对该系统模型进行了可行性分析和流程说明。
其他文献
过度节俭消费观念使消费者轻视消费注重储蓄,攀比虚荣消费观念导致消费者重视消费轻视储蓄,非理性预期偏差对消费影响具有双重性,"官僚收入"存在会引起消费水平急剧攀升。非
笔者阐述了建筑卫生陶瓷企业在建立标准化体系的过程中,如何利用过程方法和PDCA循环的基本模式来达到卫生陶瓷标准体系的方针、目标的实现和持续改进。
实验从釉料配方和烧成工艺两方面入手,对降低结晶釉析晶温度实验做出了深入的研究,成功研制出一种符合现代建筑陶瓷产品要求的新型结晶釉,并且确定了最佳工艺制度。
在网络攻击里DDoS攻击最为暴力,其攻击已经严重威胁互联网及其应用的可用性,其持续增长的安全威胁得益于手段隐蔽、易于实施、攻击效果明显和追踪困难等特性。近两年DDoS也变
<正>这种标准化淡漠反应显示出的是如机械般精密运转着的德国社会的常态:结构性压抑,一种高福利制度下,被消解的人的能动性、活力和某种尊严的压抑。不久前,柏林自由大学邀请
根据2004年采集的300个海南不同地区水稻土耕作层样品分析数据和第二次土壤普查的706个剖面点资料,对全省水稻土有机质时空变异特征进行了研究和分析。结果表明,海南水稻土有
从20世纪90年代中期开始,随着电子商务在全球范围的发展,网络银行开始兴起。网络银行业务的经营与发展给银行业带来了新的风险和问题,也给银行业的监管及风险防范提出了新的
《红楼梦》四大家族及人物命名匠心独运,大有深意,本文侧重分析系列法及其功能。
以CuO、V2O5和MnCO3为着色剂制备仿金属光泽釉。考察熔剂组成如钾长石,锂云母和铅丹及保温时间对仿金属光泽釉面效果的影响。实验结果表明:当锂云母为1wt%,钾长石40wt%和铅丹
阅读能力是一种综合性积极思维活动,它要求读者积极主动地从作者提供的书面材料中去寻求理解的线索.书面语从表面看起来是单向的,实际上阅读也是一种交际活动,是由作者和读者