论文部分内容阅读
如今的互联网时代充斥着海量信息,如何快速检索并获取所需信息成为了一项挑战。在信息服务应用中,问答系统是一种高级的信息检索系统,能够以自然语言形式回答用户提出的问题。为了提升信息服务的准确性,结构化的知识图谱被作为问答系统的底层支撑,为系统提供回答问题所需的知识,但是这又引出了知识如何表示的问题。传统的基于符号表示和语义解析的问答系统在实际使用过程中面临着计算效率低和数据稀疏性等问题,不利于问句理解,而知识表示学习技术随着深度学习的发展被越来越多的学者关注和研究,将其引入问答系统可以提升语义计算的精度和效率。本文从基于知识图谱的自动问答应用场景出发,针对知识图谱中的语义信息难以被充分利用以及用户提出的自然语言问题的多样性与歧义性等问题,设计并实现了一种基于知识表示学习的自动问答系统。具体地可分为三个研究内容:首先,为了在以自动问答为代表的下游应用中更方便地操作知识图谱,通过知识表示学习将知识图谱中的实体和关系映射到连续的向量空间,同时包含一定的语义层面的信息;其次,为了实现问句中的短语到知识图谱上实体的正确映射,进而生成结构化的查询,通过结合表示学习与深度神经网络的实体链接模型来解决映射过程中的歧义性问题;最后,将前述知识图谱表示算法、实体链接算法应用于问答系统的问句理解模块,实现一个较为完整的基于知识图谱的自动问答系统。本文的关键算法在于融合多源信息的知识表示学习模型和基于深度学习和知识表示的联合实体链接模型。前者在现有的知识表示学习模型TransE的基础上融合了实体文本描述信息和实体类别信息,相比于仅仅依赖于三元组结构的表示强化了语义关系、提升了计算效率;后者利用深度学习技术的优势提取实体指称与候选实体的多粒度的表示特征,解决了包含语义信息的实体链接和词义消歧问题,帮助本文的问答系统更准确地理解问句的语义信息。实验表明,两种模型在知识表示和实体链接上的效果优于基线模型。为了实现知识问答系统,本文首先对相关背景技术进行了调研。然后依据用户需求和相关技术对系统进行了总体需求分析,列举了功能性需求和非功能性需求。针对其中的知识表示和实体链接两个关键问题,论文展开研究并给出了解决方案,并根据评估标准对模型的有效性进行了实验和分析。最后,在完成关键问题研究工作的基础上,进行知识问答系统的总体设计与详细设计,包括关键任务工作流程的交互设计和各模块接口设计。基于设计完成系统实现后,论文对该系统进行了相关测试与分析,证明了系统的可用性、易用性和用户友好性。