论文部分内容阅读
近年来,基于人工智能技术的问题求解、自动证明、类人答题等应用已经成为研究的热点,并不断取得新的突破。自然语言处理是人工智能研究的一个重要内容,其研究方法主要包括基于规则的方法和基于统计的方法,尤其是基于大规模语料库的机器学习算法的成熟,使得基于统计的自然语言处理方法成为主流。但是随着求解问题变得复杂,单一的自然语言处理方法很难取得很高的效率。本文利用上世纪90年代提出的句模理论,并结合机器学习方法对文本形式的初等数学问题进行自然语言处理,实现数学问题的题意理解。本文主要进行了以下几个方面的研究:首先,在句模理论的指导下,结合汉语形式的初等数学问题的表述特点,对数学问题中的动词进行了分类讨论,并在此基础上,研究了由动核结构形成的常见句模,包括简单句模和复杂句模。数学问题的句模研究为本文的数学问题语义处理提供了基础。其次,根据数学问题概念知识的层次性和复杂性,本文采用面向对象的方法表示数学问题的知识,并提出一种具有层次结构的面向对象知识表示框架。面向对象方法具有抽象、封装和继承等基本特征,利用这些特征,能够很好地处理数学概念以及概念间关系的表示问题。本文还对传统的知识对象模型进行了改进,将其中的规则属性分离出来,简化了知识对象的结构。然后,研究数学问题题意理解的方法,其中最核心的是基于句模的句子语义处理算法。该算法对所属句模不同但意义等价的句子进行语义归一化处理,提取句子中所含的知识。在此之前,分析了句模的表示问题,主要包含句模特征、语义成分数据和归一化函数等。为了提高句模匹配的效率,本文还研究了基于条件随机场的数学实体识别方法,用于提取句子的标注特征。通过实验验证,该方法的识别准确率和F1值分别达到了97.13%和94.98%。最后,根据本文提出的方法,构建了一个题意理解系统,用于初等数学问题的题意分析。通过测试分析了系统性能和题意理解的效果,其结果表明本文实现的题意理解系统基本能够实现数学问题的题意分析。