公路桥梁定期检测领域命名实体识别语料库构建

来源 :计算机应用 | 被引量 : 1次 | 上传用户:chibi2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前业界缺少适应我国公路桥梁检测领域文本特性的中文命名实体语料库的现状,构建一个较大规模并具有较高标注质量的公路桥梁定期检测命名实体语料库。在分析该类型文本的领域特性基础上,定义了由桥梁实体、结构实体、结构病害实体等六种目标命名实体类别及其标注规范,完成了1 245份真实桥梁检测报告和1 400余万字相关网页文本信息的数据准备和预处理工作,选取了其中150份作为标注语料并完成了多轮迭代标注,标注总字数超过32万字,各类型实体最终标注一致性最高达到98.5%,最低达到85.2%。选取了当前命名实体
其他文献
节目主持人:晨冬、笑笑床前明月光,堵车心不慌,轻松何处寻,欢乐正前方。从2004年到2018年,《欢乐正前方》一直在路上,由原来的段子笑话到现在的变用户为内容,不变的是让大家
期刊
JT
新疆阿克苏地区电视台译制中心译制网络系统是以数字音频工作站为基础的数字化、网络化的影视剧译制系统。着重介绍通过网络和相关硬件,实现视音频节目采集、语音录制、音效
在社会经济和科技的深化发展下,广播电视技术也得到了进一步完善,在广播电视传播信息增多的情况下,人们对广播电视的技术要求不断提升.多种技术在广播电视中的应用在某种程度
针对最小生树不唯一,如何选择最优的最小生成树的问题,提出了将破圈法和可拓层次分析法相结合的方法。首先,用破圈法求出一个最小生成树;其次,对连通图进行约化,得出约化图,标记固定边,求出换入边,用破圈法的思想求出全部的最小生成树;因最小生成树的结构不相同,节点之间的连接方式也不相同,最小生成树的选取就有了区别,最后,采用可拓层次分析法对全部最小生成树进行评价,从最小生成树的节点度为1的节点比例、聚类系
摘要 为筛选和推广防治小麦赤霉病效果好的药剂,开展了不同药剂防治小麦赤霉病药效比较试验。结果表明,试验药剂在扬花初期喷施,对小麦赤霉病均有良好的防治效果,其中48%氰烯·戊唑醇悬浮剂、35%戊唑·福美双悬浮剂、430 g/L戊唑醇悬浮剂对小麦赤霉病的病指防效均在75%以上,可用于防治小麦赤霉病,其他药剂可作为轮换药剂使用。  关键词 小麦赤霉病;药剂防治;病穗防效;病指防效  中图分类号 S435
为了保障广西广播电视技术中心协同办公系统的业务不间断运行,数据备份的重要性不言而喻。本文结合实例,主要介绍用于该系统的服务器镜像双机热备份的原理与实现方法。
针对电力审计领域的文本具有行业特征明显、文本特征相似度高、分类边界模糊的特性,提出了增强领域特征的电力审计文本分类方法。首先构建面向电力审计的专业词典,提出EF-Doc2VecC模型再联合专业词典增强文本的特征,最后送入BiLSTM分类器实现专业领域的文本分类。实验结果表明,针对专业性显著的电力审计类文本分类,EF-Doc2Vec模型,在召回率、特异性、准确率和F1值分类指标上比对照模型Doc2V
针对新一代种群在并行遗传算法收敛过程中产生旧的个体可能性逐渐增大导致重复计算适应度的问题,提出一种基于散列函数加速的并行遗传算法(HPGA)。一方面利用散列函数查表时间复杂度低的优势,在散列表中存储算法运行中产生的个体以及其相应的适应度,减少个体适应度的重复计算;另一方面利用时间戳替代键,改进散列表存储方式,从而解决散列函数处理冲突的问题。通过求解集合覆盖问题对比了原始并行遗传算法和HPGA,结果
10只雄、雌鹌鹑的泌尿生殖系统的解剖和组织学观察表明:鹌鹤的泌尿器官仅有肾脏和输尿管,而无膀胱及尿道.肾脏发达,约占体重的1%以上.雄性鹌鹑生殖器官包括睾丸、附睾、输精
为了在云计算平台发生宕机时进行有效的资源配置,提出一种面向数据密集型应用的容错资源配置方法(FRPM)。首先,将数据密集型应用建模为工作流模型,并且基于虚拟层2(VL2)网络拓扑结构建立了宕机任务时间恢复时间模型和负载均衡模型;然后,利用非支配排序遗传算法(NSGA-Ⅲ)实现对数据密集型应用的完成时间和云平台所有计算节点负载均衡进行联合优化,从而为部署在宕机节点上应用找到有效的资源配置策略;最后,