论文部分内容阅读
国家及自治区高度重视新疆少数民族语言信息处理,从早期的文字处理技术,到目前语音处理技术以及汉语与少数民族语言的自然语言理解处理技术等,所有工作都是围绕“缩小民族间数字鸿沟”,加强民族间文化、经济交流,推动地方经济社会发展和维护国家安全开展。自然语言的机器自动评分是计算机辅助语言学习和客观评测系统的最重要实际应用之一,语音自动评测技术已广泛应用于汉语、英语等的语言学习评测中。目前,针对新疆地区维吾尔语的语音评测技术尚属起步阶段,主要原因包括:相应语音语料库的积累和建设比较少,同时针对维吾尔语文字的信息处理技术同语音评测相关技术结合进行系统地研究起步较晚等。本文主要针对维吾尔语的语音自动评测技术开展研究,研究建立维吾尔语发音质量评估系统,一方面,开展相应维吾尔语音语料库基础积累建设及语音评测关键技术研究,提升维吾尔语语音评测相关技术研究水平,另一方面,开展语音自动评测技术在新疆双语教育学习中的应用。
本文围绕我们的维语发音质量评估系统,进行了以技术为主的详细论述。该系统基于隐马尔可夫(HMM)语音识别框架,并且同时使用了有限状态机、基频共振峰分析、非线性分类等技术,从短时发音准确性、长时发音准确性、发音易混淆性、语音语调合理性等多个角度,对维语的发音质量进行评估,在评估算法的设计上尽可能地体现综合性、客观性。
本文首先从整体上描述了我们的系统,较详细地介绍了系统每个模块的功能和原理,并重点描述了四个关键的技术点,之后展示了实验结果和应用模板,最后给出了结论。
本文的主要创新点包括:
1.实现了基于双层词法分析和最小描述长度的维语子词的机器切分器,针对维语的语言特性,把维语单词自动切分成一个个子词,有利于后续步骤的评分。
2.引入了了音素解码器计算后验概率的分母,使在子词级别直接计算置信度成为可能,从而得到长时评分特征,提高了评分的全面性和准确性。
3.采用了对大词表语音识别的结果词图和混淆网络进行分析的评分方法,解决了强制对齐方法对某些特定错误难以检出的问题。
4.设计了基于基频共振峰的语调韵律的评分方法,研究了使用混合高斯模型对基频共振峰建模并计算语调韵律发音良好度的方法。