粮食产后损失知识图谱的构建及建模分析研究

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:hdu07095238
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国是一个资源极度紧缺的国家,粮食供求关系长期偏紧,减少粮食产后损失潜力巨大,具有重要的战略意义。随着粮食物联网等技术的发展,粮食产后损失数据呈现增长迅速、来源繁多、结构复杂、获取和管理困难等诸多问题。尤其是来源繁多、结构复杂的问题直接制约着粮食损失信息高效检索与关联分析。因此,生成粮食产后损失变量之间的关系模型、构建粮食产后损失浪费数据体系、建立粮食产后损失分类模型对节粮减损有着至关重要的支撑作用。针对上述问题,本文通过构建知识图谱,并基于图谱中的实体属性信息进行粮食产后损失数据建模分析研究,具体工作如下:第一,本文基于scrapy框架爬取统计局、粮食局等网站的相关数据,对这些数据进行清洗、标注,进而整合形成语料库,并对其数据进行分词及词性标注。同时结合基于启发式规则和k最近邻算法对数据进行筛选和分类。其中,分类划分了14个实体类别,如粮食产后损失、植物学名词等。实体抽取实验结果表明,k最近邻算法加权后的分类准确度率比加权前的准确率高5.3%,验证了本方法在实体识别方面的有效性。第二,针对实体间的关系提取问题,将其任务抽象为分类问题。本文通过句法分析生成语句的句法分析树,获得词法信息和句法信息。接着通过语句的特定结构获得语义信息,并结合CNN算法模型和PCNN算法模型对实体关系进行分类。其中,分类主要分为7种实体间关系,如性质、上级分类等。最后结合实体和实体间的关系进行构建粮食产后损失知识图谱,并将其可视化。实验结果表明,PCNN模型的分类准确率比CNN模型高7.6%。说明PCNN模型对于实体关系抽取的性能效果好于CNN模型,对于句子的分段操作,可以更好地表示文本特征。第三,在粮食产后损失知识图谱的基础上获取相关的损失因素,如收获时间、虫害程度等,基于损失因素获取相关损失数据。并结合k最近邻、逻辑回归、决策树、XGBoost等算法,提出了一种针对粮食产后损失的多模型融合分类方法。该方法主要将粮食损失程度定性分为“极少”、“一般”、“严重”和“极其严重”四类。实验结果表明,本文提出的多模型融合分类方法在粮食产后损失分类方面的结果较为理想,召回率、准确率和F1值分别为94.0%、94.0%、93.2%,三种评价指标均优于传统的分类方法。另外,本文还设计与实现了一个粮食产后损失知识图谱系统。该系统可实现实体识别,关系查询,粮食知识概览。
其他文献
随着全球经济的迅速发展,给酒店业提供了良好的发展平台,需要大量的专业酒店管理人才。但是,近几年来出现了酒店管理专业学生潜流失的现象,对酒店业的发展产生了一定的影响。本文
致力于探讨迟子建笔下的乡村世界,发现:这里的人生是残缺的、悲剧性的,而迟子建以月光与酒式的生命哲学应对这生命中本有的残缺,使生命回复到初始的圆融状态。
玉米胚芽油含有丰富的不饱和脂肪酸、维生素E、甾醇、亚麻酸、类胡萝卜素、多酚等多种生物活性物质。玉米胚芽油的提取方法主要有压榨法、溶剂浸出法、水酶法、CO2超临界萃取
随着环境问题与资源问题日益严峻,生物降解聚酯因其环境友好的特性在科研、生产领域都得到了越来越多的关注与重视。以生物降解聚酯作为基体进行复合材料制备,可以实现对聚酯
新闻传播有着传递社会文化和信息的作用。它不仅能让人们对社会事件有着清晰的认知,还能满足人们自身的各种期待。本文首先描述了文化秩序的含义,其次讲述了带有倾向性的新闻
从《括言》之主要内容来看,聂双江在1537年提出了一个以"不睹不闻"之"未发"为本体、以"不睹不闻之戒惧"为工夫的思想体系,并在1538年具体呈现了这一思想体系既"融贯"又"分辩"之特色。此
目的通过对定陶县妇幼保健院的产检数据分析,掌握农村产前保健的现状,发现影响产检结果的主要因素,提供面向乡村孕妇产前保健方法的理论依据,提高乡村孕妇的产前保健意识。方
随着全球化程度的不断深入及我国国力的不断增强,汉语国际教育事业发展如火如荼。在新时代的背景下,变革与影响成为了当今社会发展的主题,在学校中,教师则是变革的主要动力。
如今随着时代的发展,IP产业作为一个新兴产业变的越来越受欢迎。IP产业链触及的产业广泛,无论是在衣、食、住、行还是教育、医疗等其他方面。我国进入IP产业时代相对较晚,但
目的优选猪苓多糖的最佳提取工艺,评价其体外抗氧化活性。方法以猪苓多糖得率为指标,通过超声波辅助提取,以提取时间、液料比和超声功率为影响因素,设计三因素三水平的响应面