论文部分内容阅读
随着中国移动通信集团黑龙江有限公司用户规模的不断增长、现有业务的不断发展以及新业务的不断推广,广大用户对业务咨询、问题投诉等方面的服务需求也显著增加,导致客户服务的压力随之加大。而同时,一方面静态常问问题集(FAQ,frequently asked questions)的方式难以给用户以快速准确的解答,另一方面人工服务却需要经常进行简单重复性的回复。为此,迫切需要开发一套完整的客户服务自动问答系统,从而实现分流客服压力、提高服务效率的目标。本文采用B/S架构,选用Apache服务器,设计并实现了黑龙江移动客户服务自动问答系统,该系统属于基于受限域FAQ的自动问答系统,其特点是将移动通信领域的FAQ作为答案来源,通过检索FAQ来返回与用户查询相匹配的问答对。本文通过以双数组Trie树的方式进行中文分词,缩短了系统的响应时间,利用词性标注与停用词表、疑问词表结合的方式,实现了对问句的语义信息的识别以及问句焦点的确定。采取按照城市分类的方式对FAQ建立索引,保存常问问答对的重要信息,在此基础上实现了问句分类检索,从而提高了问句检索的速度。通过问句分析及相似度计算,实现了问句的查找和匹配,其中,采用改进的向量空间模型进行相似度计算,提高了系统的检索准确率。经过功能和性能测试,结果表明系统达到了预期目标,满足了用户的功能需求,并且在收集的问答对集合中确实包含满足用户需求的问句的前提下,系统前三个返回结果包含用户需求问答对的结果准确率达到85%以上,在网络通畅的前提下,系统的响应时间小于1秒,证明本文建立完成了一个基于互联网的、具有自然语言接口的、具有很高的准确度与实时性的自动问答系统,能够应用于移动通信领域,以缓解客户服务压力。