基于Bi-LSTM-CRF的中文电力实体识别

来源 :信息技术 | 被引量 : 0次 | 上传用户:thinkcell
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电力系统科学研究与生产实践的长期发展,积累了大量的非结构化和半结构化文本。对电力领域文本进行中文实体识别,是其进一步信息抽取的基础工作。为探索有效的电力实体识别方法,文中首先把电力实体分成十六种并对三类电力文本信息进行标注,进而采用双向长短时记忆网络和条件随机场的混合方法,对标注的电力文本进行了中文实体识别实验,并与隐马尔科夫法、独立的条件随机场法和独立的双向长短时记忆网络法进行对比。实验结果表明,文中采用的Bi-LSTM-CRF方法可以更加准确有效地识别文本中的电力实体。
其他文献
以台湾地区能源政策为例,借鉴豪利特和拉米什提出的政策工具分类思想,建构政策工具和政策目标的二维分析框架,对台湾地区《能源发展纲领》进行文本分析。研究发现,在政策工具维度上,台湾地区能源政策虽兼顾自愿性、混合型和强制性三类政策工具,但仍存在自愿性政策工具稀缺、混合型政策工具结构失衡、强制性政策工具过多的问题。在政策目标维度上,能源安全、绿色经济、环境永续和社会公平的指标设计较为合理,但台湾当局对政策目标的侧重点具有差异,且政策目标与政策工具不够匹配。因此,大陆应吸取台湾地区能源政策制定的经验教训,充分发挥个
为解决数字化展示与推广羌绣文化遗产时,未考虑用户自身兴趣与否的问题,建立了基于上下文感知机制的羌绣数字化管理系统。该系统共分为三个层级:数据层、支撑层以及应用层。各层级之间通过知识库管理与上下文感知管理子系统相连接,为不同用户定制不同展示及推荐信息。通过仿真分析,与传统Panoramio方法相比,文中所提方法在时间复杂度与推荐信息数量方面均有一定优势。该系统的建立为羌绣文化遗产展示与推广起到了一定借鉴作用。