论文部分内容阅读
由于国内语言的特殊性,需要对主观题进行自然语言处理才能进一步的对其进行处理,主观题自动评分属于自然语言处理模块,目前国内的考试系统只能对一些客观题进行评分,还不能对主观题进行自动评分,我国的主观题自动评分算法主要有:基于向量空间模型的主观题评分,基于单向贴近度的主观题算法,基于动态规划的语句相似度计算方法,基于改进的LDA模型的中文主观题自动评分等,这些算法没有考虑语义之间的逻辑关系,在实际应用中效果不好。本文提出了基于案例推理的主观题自动评分系统,将案例推理理论应用到主观题自动评分中。将中文句子进行自然语言处理,通过分词技术将句子分成不同的词,在考虑词与词之间的逻辑关系,在案例检索阶段将依存句法应用于案例推理中,将句子分为:关键词,核心词,其他词。找出句子的主干部分,脱离了基于词频的文本相似度计算模型,将逻辑关系考虑进来,进一步的提升了主观题评分的准确性。在案例重用阶段建立置信度约束的案例重用模型,与传统的方法不同,本文提出了一种动态确定阈值的方法,通过置信度阈值优化计算模型,以改进案例推理结果的可靠性与准确性,同时解决了在阈值确定中,阈值过高的问题。文中采用了Boot Strap方法来扩增样本,对于样本容量较小的数据也能有效的确定其阈值。在文章的最后,从软件开发的角度设计自动评分系统的体系结构、业务流程、功能模块,并且完成了基于案例推理的主观题评分系统的设计和实现。