论文部分内容阅读
企业财务审计专业程度高,知识体系庞大,更新速度快,审计人员在工作中会遇到各种问题和情况,需要高效、准确地获取领域知识,以解决遇到的困难。而现有的审计信息化软件多针对于审计事务管理,缺少获取和检索具体审计领域知识的相关功能。因此,研究面向企业财务审计领域的问答系统关键技术,用自然语言快速、精准地回答审计人员的问题,为他们提供专业、智能、方便的问答服务,具有深远的研究意义和较高的应用价值。本文以上述问题为出发点,以深度学习理论作为支撑,针对企业财务审计领域的问答系统关键技术进行了深入研究。本文将问答系统划分为两个关键模块:实体识别与问答检索。在实体识别模块,本文构建了基于长短期记忆循环神经网络模型(Bi-LTSM)与条件随机场模型(CRF)融合的领域实体识别算法。在问答检索模块,本文构建了基于多粒度文本匹配的问答检索模型,以此为基础,搭建了企业财务审计领域问答系统。企业财务审计领域实体识别有助于理解用户问题的核心语义,其识别效果直接影响到后续问答检索的效果。在实体识别阶段,首先对语料进行预处理,构建领域词典、指示词等富含领域知识的特征,再结合Bi-LTSM和CRF进行实体识别,从而解决了企业财务审计领域实体识别效果不佳的问题。在问答检索阶段,首先利用基于注意力机制的两路编码模型对句子的局部信息以及全局信息进行建模,再使用交互式文本匹配模型在输入层直接进行交互,利用多层卷积神经网络模型(CNN)从交互矩阵中提取细微的匹配特征;然后,本文引入实体识别阶段识别出的实体作为输入特征,进一步提升效果;最后,本文采用两种匹配方式(问题-问题匹配与问题-答案匹配)结合的方法计算最终的匹配得分,返回给用户得分最高的答案,提升了问答检索的准确性。最后,本文就上述算法和模型分别进行了对比实验,验证了基于Bi-LSTM+CRF融合的企业财务审计领域实体识别算法和基于多粒度文本匹配的问答检索模型的有效性及应用价值。