基于网络的农业信息抽取与数据挖掘系统

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:cjl7648893
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文的研究内容是实验室课题项目“电脑农业”的一部分。由于农业信息具有随季节,周期和区域变化的特点,对农业信息的实时采集工作就显得尤为重要。基于Web的信息抽取和数据挖掘技术在农业领域的应用能够明显缩短农民获取信息的渠道,减少中间环节,并且能更好的指导农民作业。本文参考前人经验提出了一种改进的神经网络主要题爬虫,通过优化神经网络的激励函数来提高爬虫的效能。传统的网络信息抽取系统都采用的是包装器模式,虽然这种方法抽取的效果较好,但并不能适应网页格式的变化。本文提出了一个基于距离矩阵的抽取算法,并结合了Web主题爬虫程序的特点,建立了一种新型的Web信息提取系统。该模型可以实时、自动地收集网络上的数据,并在对数据进行整理、清洗后存入后台数据库。然后建立查询网站,使搜集到的结果能够通过网页的形式展现给用户。 本文简述了数据挖掘的基本原理及其在各个领域的应用情况,特别介绍了Oracle数据库,数据仓库环境下建立数据挖掘的解决方案,并基于oracle ODM技术提出了利用数据挖掘技术建立完整的具有收集、抽取、查询、预测等功能的农产品价格预测分析系统,给出了数据挖掘技术在该系统中的应用方法及技术路线。在此基础上还提出了一种新的以偏最小二乘算法为基础并结合神经网络的数据挖掘算法作为ODM的重要补充,并且也以网页的形式为最终用户提供服务。
其他文献
血管造影技术是一种广泛使用的血管可视化技术,是血管疾病无创诊断与介入治疗的重要依据。重建血管的三维结构,可以使临床诊断和治疗提供更强大的依据。因此对血管三维结构的
锅炉是火电厂关键的动力设备,也是能耗最大的装置,锅炉燃烧控制系统又是锅炉控制系统的重要部分,因此,对锅炉燃烧系统实施先进控制并将其投入实际运用,这对提高锅炉的热效率、降低
随着电子测量技术的快速发展,测试仪器的种类也日益繁多,但不同厂商开发同类仪器标准不一,使得仪器开发周期较长、仪器界面的可重用性较低。为了减少同类仪器上层界面的开发周期、成本以及提高软件后期修改和维护的便利性,统一各个厂商同类仪器开发的标准,实现仪器底层驱动和硬件的可互换具有重要意义。本文借鉴IVI(可互换虚拟仪器)思想,提取同类仪器的共同属性和功能形成可互换引擎模块。并对可互换引擎接口的设计与实现
随着工业发展的越来越快,非方系统、非线性多变量系统由于结构的特殊性,其在实施自动控制时常常伴随一些较为困难的问题。同时考虑到实际过程中系统约束条件的存在,很难直接
随着智能家居的兴起,在美国、日本等很多国家都制定了相关技术标准。我国在1999年4月制定了“住宅小区智能化技术导则”。智能家居实现以住宅为平台,兼备安全防护、网络通信、
近年来,环境污染越来越严重,石油资源越来越枯竭,寻求汽车新的动力源已经成为世界汽车领域研究和发展的热点,燃料电池电动汽车作为一种新型的节能汽车倍受关注。燃料电池最大优点
随着我国经济飞速发展、城镇化规模的扩大,城市居民在住宅内的时间日益增多,与此同时,空调系统的普及化致使住宅自然通风减少,室内空气污染加剧,居民自行采取的降温措施,尤其是室内
本文在对现有的遥操作系统广泛调研的基础上,结合了老年人看护的应用背景,研究了基于因特网的室内移动机器人遥操作系统。本论文所做的主要工作简述如下: 1.提出了一种家庭室
冬季高校教室环境品质问题日益突出,尤其是热舒适性,直接影响大学生学习效率,同时也决定了教室的能耗水平。因此,即考虑教室的节能,又保证室内热舒适性成为冬季高校教室热舒