论文部分内容阅读
“全信息自然语言理解方法论”与已有的其他方法不同,其主要特色是试图实现语法信息、语义信息、语用信息的综合利用,从而有效增强对自然语言的理解能力。本课题主要针对“奥运多语言综合信息服务”项目的典型示范系统“CityGuide”,研究语音识别后语句检错纠错方法。“CityGuide”是在智能手机平台上实现的一个信息服务终端,支持语音输入/输出,可为旅游者提供住宿、交通、旅游等方面的多语言信息服务。本文的主要研究工作和成果有:1,在智能移动终端的语音识别引擎之后引入基于全信息的自然语言理解模块。初步实验结果表明,依据“CityGuide”语料,在原有算法(包括语法、语义算法)基础上增加了语用算法和一些辅助算法,使语音识别的正确率约从52%提高到70%。2,目前该演示系统已完成在智能手机上的实验性设计、实现与测试,并尝试引入智能移动平台的语音引擎,实现语音识别及识别后利用全信息自然语言理解方法来进行纠错。目前系统主要支持单句语音输入,所支持语种为中文/英文两种语言。3,基于以上文本纠错处理方法,又进行了应用领域的扩展——智能家电领域的短信命令文本处理系统。目前,智能家电领域命令处理层的智能化、人性化还处于起步阶段,我们提出将基于全信息的自然语言理解方法引入到短信控制智能家电的命令处理过程中,可方便人机之间的对话。本文在算法上来说还是比较初步的,在很多方面还需要进行大量深入的工作。但总体来说,采用“全信息自然语言处理和理解”的方法来提高语音识别正确率是极为有效的途径,因而是一个十分重要的研究方向。