论文部分内容阅读
在一个信息技术高速发展的时代,如何获取信息和传递信息是值得关注的两大问题。人机对话系统的研究正是聚焦在这两大问题上,力图使信息的获取和传递变得更加轻松自然,使人们可以更加方便自如地与计算机进行信息交互。本文的目标是在对人机对话系统所需技术进行深入研究的基础上,实现一个面向受限领域的汉语口语人机对话系统,研究重点是系统框架的构建、语言处理技术的应用以及对话管理方法的选择。口语分析与传统的自然语言理解技术有着密切关系,然而又有其自身的特点和难点。本文旨在探讨口语分析中可能遇到的问题及其解决途径,介绍了目前国内外较为成功的一些口语系统,对其中采取的有代表性的口语分析方法做了较为全面和深入的分析。传统的自然语言理解方法不能适应自发的口语中大量重复、省略、成分无序、语气词随意等现象,因此本文以提高规则的描述能力作为指导思想,提出了一种改进的CFG文法,同时改造了传统的Tomita算法,并在此基础上设计出基于概念识别的口语分析器。系统的句法和语义分析都是围绕该规则文法进行的。同时,作者也初步探讨了对话管理中的话语分析方法,提出主题树的知识表示方法,用树形结构描述对话过程中涉及的各项信息,将领域概念和对话历史的表示结合起来,并在此结构基础上进行知识管理,组织应答数据库,提供应答模板。本文在结合分析了汉语的句法、语义、语用等多种知识源后,实现了一个适用于美容产品信息咨询领域的口语对话系统。作者收集了领域内的口语语料,从中提取出基于概念的领域词汇组成词表,并分析了口语会话中的各种语言现象,从而编写了相应的语法规则。实验证明对话系统的口语分析器具有一定的鲁棒性,在相关领域内取得了较好的效果。在最后一章中作者对本文所做的各项工作给以总结,并对未来如何进一步改进口语分析器以及对话系统框架的可定制性做出展望。