论文部分内容阅读
随着AlphaGo大战围棋大师李世石的精彩比赛,人工智能再次火遍全世界。加上互联网的进步与发展,语音识别技术和自然语言处理技术的升级,智能聊天机器人技术也在迅速发展。同时聊天机器人也被看作成了人机交互的未来和流量入口的关键。但是目前闲聊型聊天机器人的发展并没有达到自如交流的目标,反而是一种基于特定领域的客服机器人大行其道。这种基于特定领域的客服机器人,有很强的应用场景和广阔的市场。无论在教育领域,金融领域,还是医疗领域都有着广泛的应用,通过使用客服机器人,可以提高效率,减少人力资源。而且这种基于特定领域的客服机器人结合了当前最为火热的自然语言处理技术和深度神经网络技术。本文提出了基于特定领域客服机器人的设计和相关算法的实现。这是一种多轮对话和单轮问答相结合的客服机器人。本文客服机器人采用了多种自然语言处理任务和深度学习技术相结合的方式实现,既支持固定知识库常用问题的单轮问答模式,也支持通过多轮对话获取用户信息完成业务的模式。首先,实现了单轮问答子系统。该子系统主要涉及到了中文分词,词向量转换,以及相似度匹配算法等关键技术的实现。其中中文分词针对开源算法HanLP工具进行介绍和实现;词向量转换则首先通过爬虫爬取人民日报语料资源,然后通过构建并训练FastText模型得出;最后相似度匹配算法则选择的是向量间的余弦相似度实现。同时将单轮问答服务部署在多个服务器节点并通过反向代理技术Nginx进行负载均衡。其次,实现了多轮对话子系统。该子系统主要提出了一种多轮对话配置模型,并设计实现了意图识别算法,实体识别算法等算法模型。其中意图识别通过构建和训练TextCNN模型实现,实体识别则通过BiLSTM-CRF模型训练实现。最后通过Flask框架将系统发布成RESTful API的方式进行服务。这种方式可以方便的提供服务给PC端或者移动端。最后,本文针对客服机器人系统中涉及到的算法的实现和模型的构建进行了充分对比测试和验证,同时通过接口测试的方式针对系统的接口调用进行了多种不同的测试,并分析了每个接口的返回包。最终,验证了系统满足需求。