论文部分内容阅读
在当前的自然语言处理领域,问答系统是一个非常值得研究的“热门”课题。它既允许用户以自然语言提问,又能够向用户返回准确的答案,而不是一些内容相关的网页。所以,与传统的基于关键字匹配的搜索引擎(例如Google)相比,问答系统能够更好地满足用户的查询需求,能够更准确地检索出用户所需要的答案,具有方便、快捷、高效等特点。但是目前的问答系统准确率都不高。研究表明,其中一个很重要的原因,在于目前的问答系统很少用到推理技术,大规模运用推理规则的问答系统极其少见。问答系统缺乏推理能力,推理系统缺乏自然语言理解能力,这是一个老问题了,正是这个问题,困扰着大型知识库系统的建设,也使得花费巨大的人力物力建立起来的知识库系统难以面向公众开展达到一定质量的知识服务。因此,在前人研究的基础上,本论文提出了“模式推理”的思想,并提出一种新的问答系统模型――“浅层结构模式推理”模型。本模型主要有如下特点:①、对原始文本很少做、甚至不做人工形式化工作,而是将未经处理的、无结构的原始文本,作为知识库。而传统做法则是手工建立大规模知识库。同传统做法相比,免去了知识形式化的环节,大大节省了人力物力。②、引进句子之间的逻辑推理机制,使得问答系统可以依据一定的策略进行推理,从而能够根据现有的知识,推导出用户所需要的结论。也就是说,系统可以从现有知识出发,通过逻辑推理机制,得到新知识。而传统做法,则是简单的检索文本中现成的答案,基本上不具备逻辑推理的能力。同传统做法相比,这种做法大大提高了系统的智能化。③、对于用户的查询,可给出准确的答案。而一些传统的做法,则是简单地返回相关网页或段落。同这些传统做法相比,这种做法大大提高了系统的准确性,更加方便、快捷、高效。为了实现上述“浅层结构模式推理”模型,本论文从理论上明确了模式合一的概念,定义了模式推理规则和基于模式推理的“证明”结构,并引入了包含变量的索引结构,作为实现逆向模式推理算法的基础。在此框架下,本文提出了针对不同环节的一系列算法,取得了如下的具体成果:①、提出双模式合一的“减首去尾”算法。基于这个算法,提出了一整套的模式推理机制,并对这套推理机制进行了优化、改进,有效解决了文本目标模式根据文本事实库、文本规则库进行模式推理的问题。