采用融合规则与BERT-FLAT模型对营养健康领域命名实体识别

来源 :农业工程学报 | 被引量 : 0次 | 上传用户:lp51443712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类营养健康命名实体识别旨在检测营养健康文本中的营养实体,是进一步挖掘营养健康信息的关键步骤.虽然深度学习模型广泛应用在人类营养健康命名实体识别中,但没有充分考虑到营养健康文本中含有大量的复杂实体而出现长距离依赖的特点,且未能充分考虑词汇信息和位置信息.针对人类营养健康文本的特点,该研究提出了融合规则与BERT-FLAT(Bidirectional Encoder Representations from Transfromers-Flat Lattice Transformer,转换器的双向编码器表征量-平格变压器)模型的营养健康文本命名实体识别方法,识别了营养健康领域中食物、营养物质、人群、部位、病症和功效作用6类实体.首先通B E RT模型将字符信息和词汇信息进行嵌入以提高模型对实体类别的识别能力,再通过位置编码与词汇边界信息结合的Transformer模型进行编码以提高模型对实体边界的识别效果,利用CRF(Coditional Random Field,条件随机场)获取字符预测序列,最后通过规则对预测序列进行修正.试验结果表明,融合规则与BERT-FLAT模型的人类营养健康领域识别的准确率为95.00%,召回率为88.88%,F1分数为91.81%.研究表明,该方法是一种有效的人类营养健康领域实体识别方法,可以为农业、医疗、食品安全等其他领域复杂命名实体识别提供新思路.
其他文献
科学的潜在土地利用冲突识别能够判别和协调冲突用地类型,也是有效解决当前日益严峻的土地利用冲突的基础.该研究以鞍山主城区为研究对象,基于耕作和建设适宜性评价系统开展耕地适宜性评价,通过ArcGIS软件以及耦合协调度模型进行冲突分区识别,进而根据冲突类型提出耕地差别化利用建议.研究结果表明:鞍山主城区周边耕地可划分为9类区域,包括3类潜在土地利用冲突区,占总面积的22.20%;3类耕作优势无冲突区,占总面积的67.33%;3类建设优势无冲突区,占总面积的10.47%,综合考虑城市周边耕地自然、区位和社会经济条
为研究茶叶热风烘干过程中内部水分的变化规律,该试验以绿茶为例,通过对揉捻后的茶叶进行动态热风烘干,监测不同喂入量(800~1200 g)、烘干温度(90~120℃)、滚筒转速(20~30 r/min)下的茶叶含水率变化.试验采用烘干法测定含水率,将烘干温度、滚筒转速、烘干初始水分、预测时间作为输入,含水率作为输出,分别利用多元线性回归、BP(Back Propagation)神经网络、Elman神经网络以及粒子群优化的Elman神经网络(PSO-Elman)算法建立烘干过程茶叶含水率预测模型.结果表明,温
触土部件的阻力直接影响耕作机械和工程机械的作业效率,该研究利用工程仿生设计方法,基于蝼蛄前足爪趾优异的地下掘进能力,提取前足爪趾的三维几何构形特征用于仿生试件设计,通过土槽切削阻力试验和有限元模拟,分析蝼蛄前足爪趾几何构形的减阻性能和机理.研究结果表明,前足爪趾的构形特征对切削阻力有显著影响(P<0.05),仿生试件的切削阻力较楔状体试件最高可降低56.96%,三维仿生构形的减阻性能优于一维和二维构形.蝼蛄前足爪趾构形能使被切削土壤沿挖掘面顺畅移动,避免了土壤在仿生试件尖部的堆积和对中后部的挤压,实现切削
针对目前农作物垄间导航路径识别目前存在准确性、实时性差、通用性弱及深度学习模型解释困难等问题,该研究在Unet模型的基础上进行剪枝与优化,提出了保留Unet模型特征跳跃连接优势的Fast-Unet模型,并以模型所识别的导航路径为基础,通过最小二乘法回归生成垄间导航线与偏航角.该研究首先在棉花垄间导航路径数据集上进行模型训练,随后将训练的模型迁移至玉米、甘蔗等小样本数据集进行导航路径识别,通过使用梯度加权类激活映射法对模型识别过程与迁移学习过程进行解释,对各模型识别结果进行可视化对比.Fast-Unet模型
为了对砂滤层过滤性能进行分析,该研究以粒径范围为1.0~1.18、>1.18~1.4和>1.4~1.7 mm的3种砂滤层为研究对象,以黄河泥沙作为原水杂质颗粒,采用激光衍射粒度分析仪测量了人民胜利渠泥沙粒度分布,得到了泥沙粒度分布的密度函数,并以兰考县黄河泥沙对泥沙粒度分布规律进行了验证.采用工业CT对3种砂滤层进行扫描,利用计算机图像处理技术,采用像素点覆盖法,自编程序计算了3种砂滤层横截面特征参数,孔隙率均值分别为0.421、0.431和0.439,计盒分形维数均值分别为1.695、1.709和1.7
针对现有青藏高原光核桃种核表型主要采用手工测量和目视法获得,操作繁琐,且提取参数种类有限的问题,该研究构建了一种基于HSV(Hue,Saturation,Value)空间和拟合椭圆的光核桃种核表型自动量化系统.该系统包括图像自动分割和多重参数提取2个部分,首先,采用HSV阈值法实现光核桃种核图像的精准分割;其次,用拟合椭圆法进行光核桃种核的核尖提取;最后,对光核桃种核形态、颜色、纹理3类表型进行定量描述.结果表明,该系统对光核桃种核的自动分割准确率达到99.7%,且能够实现多种表型的自动、准确量化,为光核
无人机遥感技术已逐渐成为获取作物表型参数的重要工具,如何在不降低测量精度的同时提高空间分辨率和测量通量受到表型研究人员的重视.该研究以玉米为研究对象,获取5个生育期无人机图像序列,结合小波变换与双三次插值对数码影像进行超分辨率重建,提取原始影像和重建影像的冠层结构、光谱等参数.基于单一参数和多模态数据构建地上生物量估算模型.结果表明:重建影像质量较高、失真较小,其峰值信噪比为21.5,结构相似性为0.81.航高60 m的重建影像地面采样距离与30 m的原始影像相近,但每分钟可多获取0.2 hm2地块的图像
猪只声音能够体现出其生长状态,该研究针对人工监测猪只声音造成的猪只疾病误判以及耗时耗力等问题,研究基于卷积神经网络CNN(Convolutional Neural Network)的生猪异常状态声音识别方法.该研究首先设计猪只声音实时采集系统,并利用4G通讯技术将声音信息上传至云服务器,基于专业人员指导制作猪只异常声音(生病、打架、饥饿等)数据集,提取猪只异常声音的梅尔谱图特征信息;其次引入多种注意力机制对CNN进行改进,并对CBAM(Convolutional Block Attention Modul
针对穴盘苗叶片之间相互覆盖难以利用俯视图像判断种苗品质的问题,该研究以白掌苗为研究对象,提出一种叶片下观测苗茎局部区域的方法,通过提取穴盘苗叶片下苗茎参数,结合种苗级别判断标准,实现叶片相互覆盖穴盘苗的自动化品质检测.该方法首先确定白掌苗苗茎品质分级临界值,并构建由微型相机和导光纤维组成的苗茎图像采集单元,在检测室暗室环境中捕获白掌苗叶片下光纤光斑区域苗茎图像,利用视觉算法提取苗茎图像和苗茎投影面积,通过提取的待测白掌苗苗茎投影面积与白掌苗苗茎品质分级临界值对比分析,确定不合格苗,并返回不合格苗穴孔位置信
比热、导热率和导温系数是鱼饲料重要的热特性参数,其在干燥及冷却工艺参数的调整、饲料湿热传递仿真模拟研究中均有应用.为了探究鱼饲料的热特性,同时探究反演算法求解饲料热特性的适应性,该研究以草鱼(成鱼)膨化饲料为研究对象,建立基于伴随方程法的反演模型;利用自行搭建的热传导试验装置并配合红外热像仪(测温精度±0.1℃),以获得饲料试样的温度分布规律;利用此数据可反演计算含水率为11%~17%的饲料在20~80℃温度范围内的比热、导热率和导温系数.使用差式扫描量热仪(Differential Scanning C