论文部分内容阅读
近年来,随着计算机科学、自然语言处理以及人工智能的飞速发展,智能答疑系统受到越来越多的关注,在线辅助教育、网络自动答疑等方面应用应运而生并且得到广泛使用。其中数学文字应用题自动求解是个性化辅助教育中最基础的智能解题研究,能够帮助学生实现自主学习并且不受地域和时间限制。文字应用题自动求解领域的热点问题之一就是提取有效的特征并构造自动求解模型。本文通过分析与数字相关的特征,提出三类与数字相关特征的提取方法,包括单数字特征、数字对特征及方程特征;根据文字应用题自动求解模型的解题准确率为主要依据,构建基于深层神经网络的文字代数应用题求解模型WAPNet(Word Algebra Problem Neural Network)。本文主要贡献是:首先,识别文字代数应用题中的数字并构成数字序列,提取数字序列中每一个数字在题目中的上下文信息,用上下文无关文法提取数字序列中的单个数字特征、相邻两个数字对特征和方程特征;然后,使用深层神经网络构建文字代数应用题求解模型WAPNet,以数字特征为输入,以方程模板为输出,并用PSO(Particle Swarm Optimization,PSO)对神经网络模型中权值和偏置项进行寻优,得到最优的权值和偏置项作为网络初始值,训练网络,得到最终模型;最后,以自动求解文字应用题准确率为基础,确定基于数字相关特征的文字应用题自动求解模型。本文以Alg514和Single为数据集,其中包括一元一次方程和二元一次方程组线性代数文字应用题和算术文字应用题,完成了文字应用题中与数字相关的特征提取、特征表示和网络模型构建及训练。实验表明:本文方法在Alg514数据集上进行训练和测试,并进行五折交叉验证,自动解题准确率为88.9%;相同情况下与基于对数线性模型的方法进行比较,提高了9.2%。本文方法在SingleEQ数据集上进行实验,得到89.6%的准确率,验证了本文方法的有效性。该论文有图11幅,表18个,参考文献52篇。