论文部分内容阅读
选择型问题是由一个问题句和多个候选项所组成的,类似于考试试题中的选择题。选择型问题的解答隶属于智能问答领域,研究如何从多个候选项中预测出能够回答问题的正确答案,涉及到自然语言处理、信息检索、机器学习等多个领域的技术方法。近年来,智能问答技术在工业界有广泛的应用前景,并在学术界受到了极大的关注。 本文把对选择型问题的解答看作是对候选项句子的一个排序问题。首先,本文提取出问题句和候选项之间的三类特征,分别是基于统计的特征、基于信息检索模型的相关度特征和语义相似度特征;然后利用Ranking SVM和逻辑回归两种有监督的学习方法对候选项进行打分排序;最后根据候选项排序结果来选择出问题的正确答案。另外,本文通过对问题句的成分和候选项进行分析,针对疑问词做主语、疑问词做宾语和疑问词做定语这三种问题类型提出了修正规则,对Ranking SVM方法和逻辑回归方法的结果进行规则修正。 实验结果采用在信息检索领域公认的MRR、MAP和正确率三种指标来进行评估。实验结果表明,本文提出的基于有监督学习的选择型问题解答方法是有效的。