基于增强BiLSTM-CRF模型的推文恶意软件名称识别

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zzptt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对推文中恶意软件名称识别任务存在的文本简短、非正式、实体类别单一以及实体歧义等问题,提出了一种基于BERT-BiLSTM-Self-attention-CRF的实体识别方法,以实现推文中恶意软件名称的自动识别。在BiLSTM-CRF模型的基础上,利用BERT模型编码单词语境信息,提升词嵌入的上下文语义质量,增强原有模型的语义消歧能力;同时,借助Self-attention机制学习单词间关系和句子结构特征,利用加权表征帮助单一类别实体的解码,以提升恶意软件名称实体的识别效果。通过构建包含恶意软件名称实体的
其他文献
【正】6月27日,四川省委办公厅、省政府办公厅印发了《四川省县域经济发展考核办法(试行)》(下简称《考核办法》)。《考核办法》选取16个指标对四川省183个县(市、区)进行年
基于当前物流成本的不断上升,也针对建材行业集团公司的产品结构等特点,产品的布局不合理的情况,将促使生产产品和产品间流动物流成本的增加,对于建材行业集团公司在物流成本
对交直流混联输电系统的运行风险评估中,由于历史数据的缺失及气候等因素对数据测量精度的影响,输电线路的强迫停运率往往具有随机模糊的特性.文中提出了统一的交直流系统的
【正】 河南省鲁山县,是具有悠久历史的养蚕,缫丝、织绸的蚕业重点县,驰名中外的“鲁山柞绸”就是鲁山的特产之一.该县西北距县城70公里的深山赵村乡,是鲁山的主产蚕区,年产
期刊
目的分析产科感染性疾病发生的原因,并提出相应的护理措施。方法回顾性分析我院收治的1320例产妇的临床资料,总结感染性疾病的发生率以及诱发原因。结果本组1320例,有27例发
网络剧《太子妃升职记》一度引发了2015网络收视高潮,收视率、点击率都呈现出不断上升的趋势,其背后的"狂欢化"特征值得探寻。本文主要从形象的古代化与现代化结合,语言和行为
近年来随着我国人们生活水平的提高,城镇内各年龄段的染发群体和染发人数日益增多,使得向城镇排水管道和受纳水体排放的染发废水大量增加,在增加城市污水处理难度的同时,也严重影
从鲁山县柞蚕发展现状着手,分析了柞蚕业发展存在的问题,提出发展柞蚕产业的对策和建议,以期为柞蚕业的可持续发展提供借鉴。
研究了LF蚁群聚类算法的改进问题。首次找准原则能够克服算法运行初期蚂蚁长时间遇不到待处理对象的现象,使得不同的蚂蚁一开始就能遇上不同对象。在LF算法中,当蚂蚁未负载且
农业生产结构调整的实质是资源合理配置,使各生产要素发挥最大作用。甘肃省农业基础差、底子薄、效率低,其农业生产结构调整和优化尤为重要。本研究基于甘肃省农村年鉴的农牧