【摘 要】
:
突发事件频发对人类生产生活产生了巨大威胁,迅速、准确地收集突发事件相关信息是采取应急措施的第一步。在互联网信息过载时代,靠人工收集信息的方式越来越不切实际,突发事件识别技术可以从海量文本中自动识别事件类型,为突发事件的发布、预警以及后续的追踪和应急方案制定提供信息依据。目前事件识别技术主要分为两种:基于模式匹配的方法和基于深度学习的方法。基于模式匹配的方法在特定领域内简单有效,但可移植性较差;基于
论文部分内容阅读
突发事件频发对人类生产生活产生了巨大威胁,迅速、准确地收集突发事件相关信息是采取应急措施的第一步。在互联网信息过载时代,靠人工收集信息的方式越来越不切实际,突发事件识别技术可以从海量文本中自动识别事件类型,为突发事件的发布、预警以及后续的追踪和应急方案制定提供信息依据。目前事件识别技术主要分为两种:基于模式匹配的方法和基于深度学习的方法。基于模式匹配的方法在特定领域内简单有效,但可移植性较差;基于深度学习的方法可移植性好,但需要大量带标注的语料进行训练。本文针对突发事件领域文本特点,提出了一种基于模式匹配和双层注意力网络的突发事件识别算法,实验结果表明本算法要优于单一模式匹配或神经网络的方法。本文的主要研究工作如下:(1)针对突发事件领域文本特征进行分析,提出了一种模式自动获取算法。该算法根据依存句法分析,从相关文本中自动抽取模式,并通过相关度计算对模式进行过滤。在此基础上,算法为每一个模式分配了权重,用来衡量目标语句归属于某种事件类别的概率。此外,引入基于概念知识库的词语相似度算法对模式库进行隐式扩充,提高了模式库的覆盖率。该算法仅需用户给定相关事件类型文本,就可以自动构建模式库并进行目标语句匹配,提高了算法的可移植性和可扩展性。(2)提出了一种基于模式匹配和双层注意力网络的突发事件识别算法。算法采用双向门控循环单元层编码句子信息,并引入双层注意力机制捕获隐藏触发词信息。其中一层注意力机制将模式匹配结果作为启发,构建注意力权重矩阵,将注意力偏向模式匹配识别的事件类型;另一层注意力机制为句中隐藏触发词分配更高权重,减少无关信息的噪声干扰。对两种注意力分布进行联合训练,使得模型能够学习模式匹配和隐藏触发词对识别结果的共同影响,在一定程度上实现了对模式匹配和深度学习方法的互补,提高了算法性能。
其他文献
随着民航运输业的飞速发展,机场航班的起降架次以及旅客的吞吐量都在不断增加,日益增加的航班数量与机场有限的资源之间的矛盾逐渐凸显,如何保证所有航班都能正常运行成为一个关键问题。航班的地面服务是保障航班能否正常运行的重要环节,目前机场各类服务车辆主要是由不同单位或地服公司进行单独调度,并且都是基于人工经验来进行调度方案的设计,难以保证调度结果的最优。当车辆资源紧张时,人工经验可能无法快速得到可行的方案
采用响应面法优化鸡腿菇蛋白质提取工艺,并研究最佳工艺条件下所得的鸡腿菇蛋白质的纯度。采用超声波辅助法提取鸡腿菇蛋白质,通过单因素试验研究pH、超声频率、提取时间和提取温度对鸡腿菇蛋白质得率和蛋白质纯度的影响。在单因素试验的基础上,利用响应面分析法优化超声波辅助提取鸡腿菇蛋白质的最佳工艺,并确定最佳工艺条件下鸡腿菇蛋白质的得率及纯度。超声波辅助碱溶酸沉法提取鸡腿菇蛋白质的最佳工艺为p H 12.6、
随着地铁列车运营年限的不断增加,状态监测作为一种保障行车安全的手段,可以帮助解决车载关键设备在运行时出现的故障问题。相较于额外安装传感器节点,利用原有通信网络进行状态监测的方式具有成本低、技术难度小、可行性高等优点。现阶段大规模存在通信主网为RS485、ARCNET等未采用国际标准IEC61375的列车,且在长期运行下车载设备逐渐发生故障,需进行自主化替换使其遵循国际标准。此时新旧设备因遵循不同协
半导体光活性材料,一种具有光激发产生活性氧基团和光热转换特性的材料,能有效地降解微生物与有机污染物,产生可见光活性自清洁效果。因此,在解决生物环境污染和有机污染的问题上,成为了最具潜力的材料之一。新型非金属石墨相氮化碳纳米材料(g-C3N4),由于其具有环保安全的非金属性,相对合适的带隙,可见光激发和多样化掺杂等优点,因此成为半导体光活性材料的研究热点。然而,其面临着可见光利用率较低的问题。本工作
集装箱铁水联运是集装箱多式联运的重要方式,在货物运输中发挥着重要的作用。目前我国铁水联运箱量占港口集装箱吞吐量的比例远低于发达国家,重要原因是我国水运与铁路的在港口的衔接效果不佳,目前多数港口与铁路车站之间需要公路短驳运输来衔接,增加了运输的复杂性,降低了铁水联运港口铁路集装箱的疏运效率。为解决此问题,在2019年9月,国家发改委、自然资源部等联合发布《关于加快推进铁路专用线建设的指导意见》,指出
空港枢纽是连接空侧交通和陆侧交通的关键节点,出租车离港交通系统作为空港枢纽陆侧交通系统的重要组成部分,在疏散到港旅客、提高枢纽换乘效率方面发挥着重要作用。近年来,我国航空运输业的飞速发展带来的旅客出行量的快速增长,不断对空港枢纽陆侧交通系统的交通配置提出更高要求。然而,目前我国大多数空港枢纽出租车离港交通系统普遍存在交通配置不合理、服务水平偏低以及运营成本偏高的问题。因此,本文从优化空港枢纽乘客换
随着可再生能源在配电网的大规模接入,电力系统的规模逐渐增加,配电设备数量越来越多,配电网拓扑结构日益复杂化,系统中接入的可再生能源发电装置因为其出力的随机性及波动性,可能会对配电系统带来严重度无法确定的风险,同时配电线路可能出现故障的概率越来越大,配电系统的不确定性不断增加,对配电网的安全运行带来负面影响,因此,针对配电系统线路故障率以及可再生能源接入配电系统的运行风险评估愈发重要。本文在影响配电
近年来,我国高铁建设蓬勃发展,高铁基础设施的状态检测和评价技术也与时俱进。轨道综合检测列车定期检测轨道线路状况获得的动检数据是进行轨道服役状态评价的基础性数据,同时也是一种特殊的多维时间序列数据。以机器学习理论为基础,从规模庞大的动检数据中挖掘轨道状态演化规律和数据内在关联关系,建立有效的轨道状态异常检测模型,为高铁线路状态评价和线路养护维修提供辅助决策,对高铁轨道质量评价和维护具有重要的实际意义
血脂异常是一种慢性疾病,能够引发糖尿病、中风和其他心血管疾病,当前,“看病难”“看病贵”的问题仍旧存在,高脂血症患者人数却不断攀升,患者渴望得到及时诊断和治疗的需求难以满足。西医通过使用化学药物治疗高脂血症,但是会产生副作用和不良反应,中医历史悠久且理论丰富,中医的高脂血症治疗体系也正在不断完善。随着大数据、深度学习算法和计算机软硬件等技术的不断发展和不断突破,人工智能与各个行业领域间不断融合,提
均热板散热器作为最有效的被动传热装置,被广泛地应用在LED、航空航天等领域电子设备部件的散热。本文首先开展了铝制均热板的结构和制造工艺研究,之后改变外部热源环境(热源面积、位置与分布和数量),对不同充液率均热板的传热性能进行实验和数值模拟研究,旨在归纳总结得出热源环境影响的系统性规律,为工程上根据实际工况条件应用均热板提供参考。结构和工艺研究方面:本研究设计了尺寸为120×100×2 mm3的铝制