论文部分内容阅读
Internet的飞速发展使得每个人都置身于一片信息的海洋。面对排山倒海的文字信息,搜索引擎成为人们检索信息的最主要工具。人们在搜索文档时,总会在心里怀着一些问题,即使是像Google这样优秀的搜索引擎,仍然无法仅通过一两次查询就为人们心中的问题找到答案。而自动问题回答系统的出现解决了人们的这一困扰。
FDUQA系统是一个基于Internet的自动问题回答系统。用户只需在它的Web界面上输入问题,系统就会从网上找到该问题的答案和支持答案的文字片断。系统首先对问题进行详尽分析,然后利用Internet作为庞大的语料库搜索答案所在的文档,最后从候选的文档中抽取出确切的答案并评价答案的优劣。
本文对FDUQA系统的每个模块都进行了详细的介绍并逐一评测,同时也考察了查询生成策略对Web检索结果的影响,分析了Web检索模块、候选答案抽取模块、答案验证和排序模块的精度损失及其错误原因。另外,作为一个实用的系统,响应速度也被作为一个重要的考察指标。