基于深度学习的农业短文本挖掘技术研究

来源 :沈阳农业大学 | 被引量 : 0次 | 上传用户:x737101013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智慧农业的快速发展,依托互联网、大数据、人工智能技术的信息化农业技术推广方法正改变着人们获取农业知识的方式。问答社区是当前最普遍的信息化农业技术推广方式,现已积累了海量覆盖农业生产全过程、各领域的农业问答数据。但是这些具有实际应用和理论研究价值的农业文本并未得到充分、全面、高效的利用,主要原因包括:农业文本多以非结构化形式存储,无法准确转换为结构化文本;问答社区产生的农业文本具有数据量大、结构各异、文本长度短、表述不规范等特点,难以有效提取农业知识;农业文本在包含通用文本的各类语义信息基础上,还蕴含丰富的农业领域知识,难以进行精确挖掘;农业文本信息与具体的农业生产环境紧密相连,不同地域的农业信息交换困难,影响了数据共享;现有相关研究大多面向通用领域文本,对农业领域文本的适用性仍有待进一步验证。因此,为了更加全面、深入利用农业文本数据,推动信息化农业技术推广高质量发展,迫切需要探索有效的文本挖掘技术从中智能提取农业知识,使用户更加快速、便捷、高效、准确获取所需农业知识。从海量农业短文本数据中获取农业知识,首先需要利用有效的文本分类技术对文本进行精准划分,然后利用文本匹配技术,在现有文本中自动筛选出目标文本,最后从目标文本中提取所需农业知识。每个环节均影响着农业知识提取效果。因此,本文以“中国农技推广信息平台”农技问答社区的短文本问答数据为研究对象,以文本分类和文本匹配研究为基础,以农业病虫害实体识别为目标,全面总结分析现有文本分类、文本匹配及命名实体识别方法的不足,结合农业短文本特点,围绕如何增强短文本语义特征和丰富语义特征提取方式展开研究。论文主要研究内容和结果如下:(1)提出一种双向门控循环单元神经网络与多粒度卷积神经网络相结合的文本分类模型。该模型利用TF-IDF算法选择文本的特征词,采取特征词扩充及词向量加权表示方式丰富短文本语义特征;利用双向门控循环神经网络及多粒度卷积神经网络多角度提取文本深度语义特征。试验结果表明,在包括病虫草害、栽培管理、动物疫病等12个类别的农业短文本中,该模型的分类正确率达95.9%,与其他9种文本分类方法相比,分类性能优势明显。(2)提出了一种融合多语义特征的文本匹配模型。该模型利用词共现关系及文本最大匹配度作为文本语义特征,计算每组词共现对的权重,提高语义特征表达的准确性,进一步丰富了文本语义特征;根据不同语义特征特点,在参数共享的孪生神经网络结构基础上,分别运用双向长短期记忆网络、全连接网络和卷积神经网络提取搭建文本匹配模型。试验结果表明,该模型在面向农业短文本数据集时,语义相似度判断的正确率达94.15%。(3)提出了基于字、词向量相结合的农业病虫害命名实体识别模型。该模型利用字向量、词向量及词性向量丰富实体特征表达,并利用Bert预训练模型将外部语义特征信息融入到单个字向量中,进一步提高了字向量的表示能力,有效解决短文本语义特征不足的问题;利用双向长短期记忆神经网络及条件随机场模型对作物、病害、虫害、化肥、农药、部位及症状等7类命名实体进行识别。试验结果表明,该模型在识别农业病虫害相关实体时,正确率达到92.07%。
其他文献
将百合小鳞茎高效地培养成商品种球是助力百合产业升级的有效途径。目前有关鳞茎发育的基本规律尚未全面阐述,促进鳞茎发育的技术措施有待提升,本研究通过细胞组织学、生理学和分子生物学试验证实了褪黑素有利于百合小鳞茎发育,进一步克隆到两个褪黑素响应基因Lo BPM3和Lo RAV,明确了Lo BPM3和Lo RAV基因在褪黑素介导百合小鳞茎发育过程中的生物学功能,为探索百合小鳞茎发育提供了新的研究方向,为科
学位
输流管作为物质和能量传输、交换系统中必不可少的基础结构被广泛地应用于现代工业领域,工程实际中复杂的应用环境及使用需求使得输流管系统不可避免的产生过量振动。针对这一问题,涌现了大量基于输流管动力学模型的振动控制方法,就已存在方法而言,基于非线性能量阱的被动振动控制器以其宽频、自适应、高可靠性与良好的控制性能受到了广泛关注和研究。然而,非线性能量阱的非线性特性及其与输流管系统之间复杂的耦合,使其振动控
学位
统编版小学语文教材在设计与结构上以单元学习任务为核心,有效地帮助小学语文教师实现了教学方式、教学内容以及教学路径的革新。小学语文教师通过学习任务群将传统语文教材中相对零散的知识进行整合,最终形成一种学习项目让学生进行知识探究,不仅充分凸显了新课标以生为本的教育理念,更让学生在以单元为主体的学习方式中获得了全面提升与进步。基于此,以实际学情为出发点,以学习任务群为背景,将其落实于小学语文单元教学实践
期刊
《义务教育语文课程标准(2022年版)》为语文教学指明了方向。在小学语文教学中,教师以学生的语文实践为主线,以学习任务群来重构语文的课程结构和课程内容,既可以增强学生的学习积极性,又可以增加课堂的趣味性。基于此,文章就学习任务群视域下的小学语文课堂教学评价展开讨论,围绕学习这一中心,探讨课堂活动中的多元化评价方式。
期刊
西瓜(Citrullus lanatus)作为最受欢迎的园艺作物之一,因其果肉多汁口感甘甜清爽深受消费者的喜爱,我国西瓜生产与消费位居世界之首。西瓜为典型喜光型作物,然而设施秋冬季节栽培日照短、光强弱、有效光少等胁迫严重影响西瓜正常的生长与发育,降低了西瓜果实的商品价值,成为影响设施西瓜效益的重要因素。本文选用两种不同瓤色的小果型西瓜,在秋冬茬(10月-翌年1月)设施栽培中使用发光二极管(Ligh
学位
天女木兰(Magnolia sieboldii K.Koch)是著名的观赏和药用植物,具有重要的经济价值。种子属于形态生理休眠类型,自然繁殖能力极弱。本研究以天女木兰种子为研究对象,通过激素处理找到打破种子生理休眠的吸胀条件;以此为基础,利用Illumina高通量测序及基因共表达网络分析,挖掘到与种子生理休眠解除密切相关的MEdarkturquoise模块及模块内的核心基因Ms DOG1;通过PC
学位
大豆胞囊线虫(Heterodera glycines,SCN)病可以严重影响大豆的产量,每年因病害造成大豆生产损失约数十亿美元,目前最经济有效的防治方法是种植抗病品种,但新的抗性品种资源和抗性基因亟待开发。现有的研究表明大豆可通过调节氨基酸代谢实现抗性,而大豆胞囊线虫也分泌效应子影响芳香氨基酸代谢而抑制抗性,这暗示芳香族氨基酸代谢同大豆对胞囊线虫的抗性紧密相关。前期筛选到与抗性相关的苯丙氨酸解氨酶
学位
黄土-古土壤序列形成发育过程复杂,其成土作用与沉积作用同步进行而有别于传统土壤发生过程,对其铁的迁移和转化了解不清。铁同位素组成分析能够明确土壤铁元素迁移的方向,揭示铁的迁移机理,更准确详尽地反映成土过程中铁的迁移和转化信息,为深入研究土壤发育过程提供新的研究手段。为此本研究以中国东北典型黄土-古土壤序列及不同形态铁锰新生体为研究材料,综合运用土壤学、地球化学和第四纪地质学的研究方法,采用不同形态
学位
生物固氮(BNF)是通过转换大气中的氮气(N2)来补充土壤氮(N)库,减少化学氮肥施用的重要方法。固氮微生物在其中发挥主导作用,豆科作物的共生固氮是最重要的固氮方式之一。田间豆科植物经常施用有机物料,玉米(Zea mays)秸秆和生物炭是常见的添加物料。这些实践常会诱导土壤固氮微生物(diazotrophs)的生长并刺激BNF,同时对豆科作物的共生固氮产生影响。关于秸秆和生物炭的施用对土壤(包括深
学位
在互联网金融背景下,许多商业银行结合互联网进一步丰富自身的金融产品,提升自身的服务水平,但由于受到各种因素的影响,银行消费者的金融权益保护方面依然存在一定的问题,特别是老年人群体,由于缺乏一定的互联网素养,在互联网金融背景下很难采取相关的措施来维护自身的权益。基于此,文章对互联网金融创新背景下老年消费者的金融权益问题与维护措施进行分析。
期刊