面向警务应用的问答系统的设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:elements17
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,人们迈入信息化时代,方便、准确获取信息变得越来越重要。问答系统摒除了传统搜索引擎只能利用关键字来定位类别或选项的弊端,可直接根据用户输入提供答案。针对警务应用,现有警务系统并不支持自然语言的查询,仅停留在计算机端操作,并以关键词方式进行查询,无法统一入口,操作繁琐。因此有必要提出一套服务于业务查询的警务问答系统,使警务人员可以基于自然语言问答的方式进行情报获取与案件的侦办。本文通过语义解析与自然语言理解,设计与实现一个面向警务应用的问答系统。主要工作如下:(1)设计实现了语义解析层中短文本分类模块,对已获取的数据使用模型进行训练,并对模型进行压缩以减小内存的占用,再采用规则对模型分类结果进行修正。通过分类分出的13个业务类别如人员信息核查、人找车等,获取行为信息;若分类为闲聊,可直接通过语料库匹配获取闲聊答案。(2)设计实现了语义解析层业务类别中基于规则的意图抽取模块,将问句中的属性意图,包括仅包含属性的属性意图、既包含属性也包含关系的属性意图,关系意图进行抽取。(3)设计实现了语义解析层业务类别中相似匹配模块,详细设计相似度计算算法,具体实现了包括词林相似度、词语级别相似度向句子的过渡、句子间相似度计算,并设置不同阈值以保障问句匹配结果的准确。(4)设计实现了语义解析层闲聊类别中问句匹配模块,首先对获取的数据进行清洗,然后采用词向量的方式,将闲聊语料库中的问句转换为词向量,拼接成矩阵以提高检索性能。再采用余弦相似度方式进行计算,最后利用不同算法进行相似度的综合运算,最终得到最匹配的问句,直接获取该问句对应的答案。本文针对警务问答系统,通过语义解析,实现了根据自然语言或语音的输入直接获取答案的功能。通过测试,自然语言解析结果(包含实体、属性、关系、行为、意图的逻辑形式)正确,答案获取结果准确,响应快速。达到了预期的目标。
其他文献
目的:躯体症状障碍(somatic symptom disorder,SSD)是以一种或多种突出的令人痛苦的躯体症状为主要特点,同时伴与躯体症状或健康相关的不恰当的感受、想法或行为的一种精神障碍。SSD患者花费过多的时间、精力关注躯体症状而严重影响了日常生活和社会功能。本研究探讨SSD患者大脑白质(white matter,WM)结构和功能连接(functional connectivity,FC
飞行器如无人机(Unmanned Aerial Vehicle,UAV)等在生产生活中的广泛应用,让自主飞行控制变成飞行器领域的核心技术和重难点问题。如何设计实现高效优质的自主飞行控制系统成为新一代智慧飞行器设计制造的关键问题之一。目前大部分飞行控制研究关注的是低延时下的人为控制;或者是编制好任务路径以硬编码的方式让飞行器按照规划好的路径前进以完成任务。这两类飞行器控制技术均不能脱离人的控制和规划
由于具备体积小,价格实惠和控制稳定的优点,多旋翼无人机近十年来被逐渐广泛应用在各个领域,亦被广泛研究。其中基于单目视觉的无人机障碍规避是众多研究问题中有挑战性的问题之一,该研究对机载传感器要求低,且对于无人机小型化智能化,多传感器融合与灾备有重要意义。同时,在深度估计研究中所提出的自监督深度估计方法大幅度降低了构建数据集并训练对应场景下深度估计模型的难度,这使得基于单目深度估计的无人机避障具有高可
基于知识图谱的问答系统(KBQA)应用越来越广,用户提出的问题也更加复杂,通常包含多个查询意图,需要进行逻辑,定量,比较等聚合型的推理运算。语义解析方法是一种实用的方法,旨在将复杂的自然语言查询转换为机器可执行的逻辑形式(logic form,LF),再通过模块化的符号执行得到最终答案。训练语义解析模型通常需要大量专家标注的“黄金(gold)”逻辑形式。但是在实际应用中,获得这种逻辑标注的成本很高
背景:在过去十年中,埃博拉病毒病(Ebola Virus Disease,EVD)在非洲反复暴发,包括2014-2016年在西非的暴发以及2018-2020年在刚果民主共和国的暴发。这些暴发导致了不同的病死率和其他社会经济影响。尽管如此,关于该病的风险和影响的文献报道却很少,特别是孕妇和儿童等特定弱势群体的相关报道更是如此。目的:本研究旨在通过文献计量学量化并可视化2010-2019年期间发表的埃
粘胶纤维是再生纤维素纤维的一种,属于生物质纤维范围,是循环经济可持续发展的重要化学纤维产品。近年来国内粘胶行业产能快速增长,同行间竞争加剧,加之政府环保政策逐年收紧,如何提升传统产品的竞争力,加快高新产品的研发,是每个国内粘胶企业所面临的问题。FBE公司主营化学纤维制品生产和销售,整理车间负责将饼丝加工成筒丝,并进行分级、包装、入库工作,其生产管理能力的高低直接影响到公司产品质量的好坏,进而影响公
近年来,越来越多的语音识别应用进入到大家的日常生活中,其中关键词识别是语音识别应用领域必不可少的关键技术之一,而这些应用设备对低功耗和噪声场景下的识别精度要求很严苛,因此本文将提出一种面向高噪声场景的低功耗关键词识别特征提取的专用集成电路模块。本文主要从算法、电路两方面去优化设计,尽可能在保证识别精度的情况下降低关键词识别特征提取的功耗,主要工作包括:(1)基于传统梅尔频率倒谱系数(Mel Fre
语音关键词识别有助于实现更好的人机交互,但是对于低信噪比下的关键词识别性能,目前难以达到理想要求。本文从算法到硬件,实现了一套可应用于低信噪比环境的关键词识别方案。在算法上,实现了卷积加循环神经网络的语音关键词识别算法。第一,本文针对低信噪比的语音关键词识别,将传统的特征提取算法替换成单维卷积神经网络,规避了手工特征提取算法在低信噪比下的性能损失。第二,本文采用定点化量化训练方法,使得权重和数据都
关键词识别技术目前正成为主流的人机交互方式,特别是在可穿戴设备、物联网等应用上十分广泛,而这些移动便携设备对低功耗的要求很严格,故设计一款符合低功耗应用要求的关键词识别产品是非常重要的。基于此,本文提出了一种面向低功耗关键词识别(Keyword Spotting,KWS)的量化卷积神经网络(Quantized Convolutional Neural Networks,QCNN)专用电路模块。本文
目的:比较腹腔镜下胆囊切除+胆总管探查取石术(LCBDE+LC)一期缝合和同期内镜下逆行胰胆管造影联合腹腔镜下胆囊切除术(ERCP+LC)治疗胆囊结石合并胆总管结石的疗效与安全性。方法:收集2015年10月至2018年10月在东南大学附属中大医院接受微创手术的胆囊结石合并胆总管结石的患者资料,共184例,根据手术方法,将患者分为LCBDE+LC一期缝合组(112例)和同期ERCP+LC组(72例)