论文部分内容阅读
自动问答作为信息检索的高级形式,是一种能直接获取准确答案的方法。语义网技术使万维网上的数据不断开放化和结构化,促进数据的共享和集成,让机器能够更容易理解和操纵数据。语义网技术使得传统自动问答技术能够更进一步,实现海量文本检索到领域知识库查询的转变。在准确理解问题的基础上,面向上层概念本体和实例层的事实结构化知识库,自动问答能够更好地完成查询应答。特定领域的自动问答主要聚焦于领域本体和知识库的构建、问句的精准理解、问句语义化解析和领域知识库的查询应答。本文设计并实现了一个基于语义网技术的军事信息领域自动问答系统,主要工作和贡献如下:1.根据不同来源的领域数据,进行了多方面信息的抽取和结构化数据解析与生成,完成领域本体和知识库的构建;2.提出了一套中文自然语言的问题理解模板,完成问句的自然语言处理后,对问句依存树进行模式解析,完成对问句依存树节点详尽的标注和依存树主干结构的提取,并给出符合问句求解的半结构化的中间表示形式;3.针对带有多状语约束的中文自然语言复杂事实类型的问题,提出了语义化的问句解析模型,将复杂事实问句拆解成多个简单事实三元组,生成带多重约束的问句元组集合的结构化查询,实现面向结构化数据知识库的查询应答。最后,将以上工作整合集成到一个名为MiliQA的系统中,并通过实验评估验证了本文工作的有效性。