基于深度学习的农业信息分类方法研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:xuqinxiaofan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家对农业的大力扶持以及互联网技术的迅猛发展,农业相关信息不断地膨胀扩大,农业信息化发展迅速,在线农业信息已经海量化。如何从海量化的农业信息中实现农业信息的快速搜索和准确定位已经变得越来越困难。在这样的背景下,选择优化的农业信息分类方法,辅助实现农业信息的快速检索、准确定位是至关重要的。本文对基于决策树、贝叶斯和深度学习的农业信息分类方法进行了研究。重点探讨了深度学习中的卷积神经网络的网络结构和网络训练过程,实现了对农业信息的自动分类,提高了文本分类的精度和效率,来增加信息的利用价值。主要工作如下:(1)数据获取及预处理部分。利用爬虫程序从中国农业信息网上获得相关栏目下的文档作为农业信息数据集,然后利用Jieba分词和Pynlpir两种分词方法对数据集进行分词处理,并利用停顿词表去除分词文件中的符号、数字等一些不能代表文本特征的无用词汇,接着运用常用的特征选择评价函数进行特征选择,在此基础上证明了利用卷积神经网络自动提取农业信息特征的可行性。(2)农业信息的两种向量化表示方法。一种是中文分词、去停顿词后抽取文本特征词然后表示成文本向量方法;一种是中文分词、去停顿词后直接表示成词向量方法;利用词向量的方法避免了传统向量表示维数过高的问题,利用深度学习的方法可以自动提取农业信息的特征词。(3)基于预处理生成的向量文件,分别利用决策树、贝叶斯和深度学习的卷积神经网络模型实现了农业信息分类,并对运行结果进行了理论分析,针对二分类与十分类的运行结果差异提出了思考,接着运用聚类的方法验证了数据集类别文本的分布情况并利用饼状图直观显示,从而验证二分类和十分类运行结果的差异是因为数据集各类别文档数目不平衡造成的。通过实验验证了卷积神经网络应用于农业信息分类问题上的可行性,并与其他现有的分类器进行比较,分析了卷积神经网络在农业信息分类上的优越性。(4)针对农业信息分类的卷积神经网络结构提出了优化思考,对实验结果进行了理论对比分析。结果表明,针对农业信息分类的网络结构中各节点均采用Sigmoid激励函数时网络分类性能下降明显,而各节点均采用Relu激励函数时网络分类性能显著提高。在调整卷积核个数实验中,增多网络模型中卷积核的个数到原来的两倍,网络最终达到了99.40%的分类精确率。
其他文献
对大荔人遗址的甜水沟剖面(TSG)全新世黄土-古土壤序列中常量元素含量、磁化率和Rb/Sr比值进行了研究和比对。结果表明:在TSG剖面发育过程中,Ca、Mg、Na表现为迁移淋失,Si、K
应用扫描电镜对国产水鳖科6属植物的果皮微形态特征进行了初步的观察。结果表明水鳖科各属植物在果皮表面纹饰及表皮细胞形态,径向壁和横向壁凸出与否等特征上存在差异,可以作为
留声机和唱片,是人类历史上第一种能够以听觉的方式获取、储存并复现声音信息的媒体。这一媒体的出现,不仅为在其之后出现的其它新兴媒体,提供了基本的音频技术手段和声音内
<正>关于李森祥的小说《台阶》的主旨,一线教师的解读各有差异。在笔者看来,文本中的"台阶"不仅仅作为一种"事物意象"充当着小说的线索,同时也与小说中人物的动作产生了千丝
期刊
对不同尺度区域的交通发展研究是交通地理学研究的重要范畴。中国不同区域间公路网络发展水平存在较大差异,仅在31个省级行政区尺度上考察这种差异存在较大局限性;在地级行政
对电子邮件真实性的鉴定,除当事人双方的认可外,还可考量对方、第三者、网络服务商的记录或者发送人的签名,对网站信息真实性的鉴定需区分一般网站信息和社交网站信息,采取不
叙述了表面处理车间的防腐结构设计方案和施工过程 ,从运行结果看 ,该方案经济合理 ,技术可行
现代生产技术的发展特点对产品的可靠性要求很高,只有高可靠性产品才能满足现代技术和生产的需要,获得高的经济效益,有高的竞争能力,打入激烈竞争的世界市场,从而获得巨大经济效益
目的 探究女贞子提取物对大强度耐力训练力竭后大鼠肝组织自由基代谢的影响。方法 采用溶剂提取法提取女贞子果实中的抗氧化物质;选取8周龄健康雄性大鼠45只,随机分为安静组