论文部分内容阅读
随着市场经济的快速发展,企业法律法制建设日趋完善。由于法律的多样性和复杂性,快速有效地获取到与自身利益密切相关的法律知识成为各企业的迫切需求。传统搜索引擎返回答案信息的冗余、错误、无关等缺点,已经无法满足法律咨询者获取精准答案的需求,因此针对企业法律领域的智能问答系统应运而生。论文围绕面向企业法律领域智能问答系统的问题理解、信息检索、答案抽取等一系列关键技术与方法进行了研究探讨。论文主要进行的工作有如下几点。(1)通过分析法律问题的特点,论文构建了企业法律问题集,并给出了企业法律领域问题分类方式;同时,为了充分理解用户的提问意图,论文提取了问题的词袋、词性和词义等基本特征,将基本特征组合形成新的特征,并编码成分类器识别的格式,然后利用SVM方法实现了对企业法律领域问题的分类。对基于SVM的面向企业法律领域问题分类算法进行了实验,实验结果表明分类具有良好的准确率。(2)针对智能问答系统的信息检索问题,构建了常见问题答案库(FAQ)和段落关键词关系库(PKR),提出了协同FAQ库和PKR库的基于句子相似度计算的信息检索算法,实现了面向企业法律领域的信息检索。(3)针对智能问答系统的答案抽取问题,论文提出了将基于关键词、语义和词袋等多种答案抽取策略融合的多策略融合答案抽取算法,并运用于面向企业法律领域智能问答系统的答案抽取中,实现了面向企业法律领域的答案抽取。(4)基于以上智能问答系统的关键技术与方法,论文设计了面向企业法律领域的智能问答原型系统(Enterprise Law Intelligent Question Answering System,简称ELIQAS),实现了原型系统的主要功能模块。