论文部分内容阅读
随着网络技术的发展,大量的信息也在呈指数增长。在大量的数据信息中获取有价值的信息来满足人们的需求显得尤为重要。相对于传统的搜索,智能问答方式可以直接返回问题答案,而不仅仅是关联列表,因此可以更加地高效满足用户的需求。为在植物百科领域提高信息获取的效率,实现一个植物百科领域的问答系统是非常必要的。通过研究与分析,实现该问答系统需要一个本领域高质量的植物知识图谱和行之有效的问句理解与分析方法。本文首先选择多种权威植物数据构建植物知识图谱,并通过对比图数据库与关系型数据库的特点,使用Neo4J图数据库持久化知识图谱内容,经过多轮知识更新与人工审核,形成比较完备的植物知识图谱。其次通过总结植物百科问题中的规律,建立了常见问题集,并不断丰富内容。最后为理解用户输入问题,结合问句特点和植物词典,改进了一种句子相似度算法来计算输入问句与常见问题集中问句的相似度。基于上述工作,实现了植物百科问答系统。对于用户的提问,该系统能自动在常见问题集中判断相似度,搜索对应问题,形成检索语句,并将答案返回给用户。此外,系统可保存检索日志,并不断更新维护常见问题集。测试结果表明,该问答系统可以有效解决用户在植物领域内的提问。