论文部分内容阅读
“开放域知识关联、推理与检索关键技术与系统”是国家863计划重点项目、项目需要探索类人智能水平,针对在真实场景下语义理解所带来的挑战,研究构建答题机器人的相关技术,积累问答系统的构建经验,具有较强的理论意义和应用价值。答题机器人的一个重要测试学科是高中地理,高中地理试题对答题者的记忆、理解、推理能力考察比较全面,是真实场景下一种高质量问答数据。因此863项目需要针对高中地理试题特点,构建一个性能较好的高中地理自动问答系统。神经网络模型由于具有将文本表示成稠密向量的特点,可以通过计算向量距离来解题,而不需要通过字面匹配,因此不会出现规则系统中模板覆盖不全的问题。但是在利用神经网络构建真实场景的问答系统时会面临很多问题,首先,已有的基于神经网络的问答系统虽然在很多问答数据上都取得了不错的性能,但是这些系统并不是针对高中地理试题,没有考虑地理试题特点。其次,高中地理试题不提供相关知识,题目相关知识的获取依赖于检索,检索虽然给题目引入相关知识,但也带来新的问题。最后,高中地理自动答题系统应当以一种用户友好的方式展示解题结果,而不仅仅是给出答案。针对以上问题,本文在高中地理无图选择题上,对高中地理的神经网络解题技术做相关探索,并在此基础上构建一个面向高中地理的神经网络自动答题器。具体地,本文从解题模型设计、解题策略改进、答题系统构建三个方面开展工作,主要工作如下:1.论文设计了针对高中地理的神经网络解题模型。考虑到高中地理试题本身缺少相关知识的特点,采用知识检索与知识编码的解题框架,设计拥有强语义编码器、复杂注意力机制的神经网络高中地理自动解题模型。同时收集并整理高中地理领域所必须的试题和知识数据,最终在整理的试题数据集上,本文的模型取得了比较好的效果。2.论文采用了使用知识矩阵支撑答题的解题策略。针对知识检索时的不准确性和不完备性,论文首次提出知识矩阵结合神经网络的解题策略。将知识矩阵放入模型中训练,解题时由模型挑选对解题有用的知识。构建知识矩阵前,利用实体知识增强知识矩阵中的句子表示。最终在知识矩阵大大降低模型所需训练的参数的同时,解题模型也在高中地理试题数据集上取得不错的结果。3.论文构建了基于神经网络的高中地理自动答题系统。答题系统能够提供词法分析、知识检索、自动答题等功能,并能够将解题相关结果以结构化形式展示出来,增强解题系统可用性。构建的答题系统在安装以后,可以在同一局域网内的任意浏览器中打开并使用,不受操作平台系统的限制。论文构建的答题系统是首个面向高中地理的神经网络答题系统,答题系统被应用于863项目,并取得一定效果。本文构建系统所使用的相关数据、模型和代码公布在https://github.com/ryanlouc/gaokao_system。