面向反恐领域的命名实体识别

来源 :中国人民公安大学 | 被引量 : 0次 | 上传用户:a410539939
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
公安反恐形势预判、应对方案制定等工作需利用包括互联网信息、案件材料在内的多种数据。涉恐文本中含有丰富的涉恐实体信息如涉恐人物、恐怖袭击地点、袭击手段等,识别涉恐实体为反恐领域信息抽取、知识图谱构建等工作提供基础支撑。本文以互联网公开的涉恐新闻文本数据为主要研究对象,研究面向反恐领域的实体识别技术。针对当前反恐领域实体识别存在公开语料集及实体标准缺乏、类别不定、识别模型结构单一、实体识别结果不能直接用于反恐领域事件抽取和知识库构建等挑战,提出一种反恐领域实体识别及利用的全流程方案。以完成涉恐实体发现与关联为目的,通过文本分类技术识别海量数据中的涉恐新闻、利用命名实体识别技术提取涉恐新闻中的细粒度实体并使用图数据库存储和关联分析实体。本文主要工作包括:(1)针对实体标准缺乏、类别不定问题,制定一套面向反恐领域的细粒度实体标签。通过制定标签规范减少了实体分类歧义对实体识别模型的影响,同时细粒度标签将角色信息编码进实体里,据此构建了反恐领域实体语料集Anti-Terr-Corpus。(2)针对传统实体识别模型结构单一、无法解决一词多义问题,提出一种基于预训练语言模型-语义编码层-标签解码层框架的反恐细粒度实体识别模型Mac BERTStacked Bi LSTM-CRF。通过Mac BERT获得融合语境信息的动态词向量表达,通过堆叠两层Bi LSTM获取关于序列前后更为丰富的上下文信息,通过CRF学习标签规律,提升分类准确率。该模型较基于静态词向量的模型在F1上增加了24.5个百分点;较单层Bi LSTM模型,F1增加了1.1个百分点;在RMRB数据集和CEC突发事件语料库上验证了模型的可适应性;实验表明该模型能够有效地捕获反恐文本中的重要实体。(3)针对反恐业务实际应用中有效标注数据较少问题,提出数据匮乏条件下应用实体识别模型的方法。使用主动学习算法在海量未标注数据集中识别对于模型学习有价值的数据进行标注,以减少实际标注数据量。根据具体数据集的实验结果得出相应需适用的基于不同策略的主动学习算法,为模型落地实战提供重要理论参考。(4)针对有效筛选涉恐文本以进行实体识别的需求,在应用领域实体识别模型的基础上,提出涉恐新闻文本分类模型Mac BERT-CLS Bi LSTM-Softmax。通过对自然文本分句、分别生成句向量后融合以代替传统截断的方法,更好地捕获文本完整语义信息从而提升了涉恐新闻长文本分类准确度。最后设计实现了涉恐新闻实体关联可视化原型系统应用验证上述技术,结合图数据库实现了对于涉恐实体的关联分析。
其他文献
随着我国机动车保有量增大,城市道路网趋于饱和,人均出行成本升高,道路资源有效利用率降低,公安交通管理部门任务繁重。在当前交通态势下,驾驶人如何能够获得及时、准确的交通出行服务信息,使其可以随交通状态变化迅速调整出行路线,便成了急需研究的课题。传统智能交通系统所采用的最优路径算法基本上没有考虑实时的交通变化,时空总体调控能力有限,在当前交通运行状态变化纷繁的城市道路网上能够起到的作用有限。基于深度学
学位
使用证据是侦查讯问策略方法中的核心内容之一,证据的如何使用很大程度上决定了整个讯问活动的成败,如何以有效的证据使用方式去最大限度地发挥证据作用一直是侦查讯问研究的重点和难点。当前,证据使用策略(Strategic Use of Evidence,以下简称SUE)中的分层分级式使用证据是学界关注的重点之一,本论文以文献研究、比较研究、实验研究的方式对证据使用策略——SUE用证技术进行了探讨和分析,总
学位
警察职业具有高危险、高负荷、高应激和高要求等特点,这使得警察群体更容易受到心理健康问题的困扰。专业心理求助是警察解决心理困扰的一种有效途径,但现实中警察在遇到无法独自解决的心理或情绪上的困扰时,选择专业心理求助的人数却很少。为探究影响警察专业心理求助的影响因素,改进警察专业心理求助的现状,本文以B市473名在职警察为研究对象,对警察社会容认度、自尊与心理求助的关系进行问卷调查,并通过SPSS23.
学位
聚乙烯和聚丙烯是应用最多的两种通用塑料,生产厂家通常会添加阻燃剂进行阻燃处理。阻燃材料的热解和燃烧特性相对聚合物纯品会发生改变,所以探究不同阻燃聚合物热解燃烧特性对于火灾调查过程中了解火势发展蔓延具有重要价值。基于此,本论文选取溴系、膨胀、无机磷、氮系阻燃剂四类共八种典型商用阻燃剂,制备了阻燃聚乙烯和阻燃聚丙烯试样并开展热解和燃烧实验研究。以制成的阻燃试样为研究对象,首先利用垂直燃烧等级测试初步验
学位
随着核能源技术的快速发展,核能源成为世界清洁能源的重要支柱,而核能源技术安全使用的先决条件是确保核设施的安全。各国核电站为确保其安全性,除应考虑因设备故障、人员失误、自然灾害等所引发核事故的保护措施,还应防范攻击者对核设施进行故意毁坏、盗窃、非法转移等行为。安全防范系统是防止核设施受到攻击者破坏的主要工具,其效能对保障核设施的安全具有关键作用。安全防范系统的效能评估是评价该系统保护下的重要资产和重
学位
在当今绿色低碳交通发展趋势下,简约、安全、高效的交叉口交通控制方式在逐渐引起人们的极大关注,交通安全管理正在从“粗放式”向“精细化”转变。停车让行控制是一种应用于无信号控制交叉口的交通控制方式,这种控制方式没有电力消耗,绿色环保,简单易执行,同时便于公安执法。而实施停车让行控制方式,就需要科学设置相应的交通控制设施。但目前在停车让行交通控制设施的设置方面,我国相关标准规范中的规定比较原则化,不够细
学位
近年来,经济结构持续优化,数字经济不断发展,利用电子商务模式开办城市民宿,提供个性化、差异化的住宿服务,成为满足市场新需求、促进社会经济发展、解决商品房积压与闲置问题的新途径。在此背景下,C2C城市民宿应运而生,市场规模迅速扩大。但与传统旅馆业不同,C2C城市民宿分布深入居民社区,涉及C2C城市民宿的犯罪行为隐蔽性更强,潜在社会危害性更大,对人民群众的日常生活安全构成严重威胁。因此,如何改进和完善
学位
随着保有量的持续增加,电动自行车已经成为我国道路交通的重要组成部分,所带来的交通安全问题也日趋严峻。信号交叉口作为城市路网的关键节点,普遍存在交通安全风险。本文意在探究信号交叉口电动自行车交通安全风险评价方法,为控制电动自行车交通风险提供理论依据。研究内容如下:从信号交叉口电动自行车交通风险定义出发,确定基于事故数据和交通冲突数据分析信号交叉口电动自行车交通安全风险影响因素,运用冲突理论建立信号交
学位
近年来,随着群体性事件、暴力恐怖犯罪、灾害事件频繁发生,公安机关在应对突发事件时,面对的形势越来越严峻,任务越来越繁重,所处的环境越来越复杂,这对公安机关应急警务保障能力提出了新的考验。公安机关是处置突发事件的主要力量,深入研究突发事件处置过程中的资源保障问题,可以最大程度地预防和提升突发事件地应对和管理水平。加强突发事件处置的应急资源保障,是确保应急工作顺利进行的关键。然而,通过实证调研发现,我
学位
本文以女性警察群体为研究对象,以社会性别理论、人职匹配理论以及工作—家庭平衡理论为基础,利用文献研究法选取工作能力、职业规划、工作满意度、职业倦怠、家庭层面、组织层面、社会层面作为职业发展影响因素研究变量,通过问卷调查法进行数据收集,利用SPSS和AMOS软件对假设进行检验,提出女性警察职业发展阻滞因素,并结合半结构化访谈法,深入剖析阻滞因素之间的形成机制,并提出优化路径。通过问卷调查结果发现:职
学位