维吾尔语语音自动评测分析及应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zphym
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国家及自治区高度重视新疆少数民族语言信息处理,从早期的文字处理技术,到目前语音处理技术以及汉语与少数民族语言的自然语言理解处理技术等,所有工作都是围绕“缩小民族间数字鸿沟”,加强民族间文化、经济交流,推动地方经济社会发展和维护国家安全开展。自然语言的机器自动评分是计算机辅助语言学习和客观评测系统的最重要实际应用之一,语音自动评测技术已广泛应用于汉语、英语等的语言学习评测中。目前,针对新疆地区维吾尔语的语音评测技术尚属起步阶段,主要原因包括:相应语音语料库的积累和建设比较少,同时针对维吾尔语文字的信息处理技术同语音评测相关技术结合进行系统地研究起步较晚等。本文主要针对维吾尔语的语音自动评测技术开展研究,研究建立维吾尔语发音质量评估系统,一方面,开展相应维吾尔语音语料库基础积累建设及语音评测关键技术研究,提升维吾尔语语音评测相关技术研究水平,另一方面,开展语音自动评测技术在新疆双语教育学习中的应用。   本文围绕我们的维语发音质量评估系统,进行了以技术为主的详细论述。该系统基于隐马尔可夫(HMM)语音识别框架,并且同时使用了有限状态机、基频共振峰分析、非线性分类等技术,从短时发音准确性、长时发音准确性、发音易混淆性、语音语调合理性等多个角度,对维语的发音质量进行评估,在评估算法的设计上尽可能地体现综合性、客观性。   本文首先从整体上描述了我们的系统,较详细地介绍了系统每个模块的功能和原理,并重点描述了四个关键的技术点,之后展示了实验结果和应用模板,最后给出了结论。   本文的主要创新点包括:   1.实现了基于双层词法分析和最小描述长度的维语子词的机器切分器,针对维语的语言特性,把维语单词自动切分成一个个子词,有利于后续步骤的评分。   2.引入了了音素解码器计算后验概率的分母,使在子词级别直接计算置信度成为可能,从而得到长时评分特征,提高了评分的全面性和准确性。   3.采用了对大词表语音识别的结果词图和混淆网络进行分析的评分方法,解决了强制对齐方法对某些特定错误难以检出的问题。   4.设计了基于基频共振峰的语调韵律的评分方法,研究了使用混合高斯模型对基频共振峰建模并计算语调韵律发音良好度的方法。
其他文献
随着集成电路制造工艺的迅速发展与应用需求的不断提高,多核处理器是目前微处理器发展的主流方向。在基于共享存储的多核处理器系统中,当多个处理器核对同一存储位置访问时,
手势识别在人机交互、聋哑人教学、虚拟现实、智能家居等领域中有着重要的应用前景。目前根据获取手势数据的方法不同,可以将其分为两个不同的方向,一是基于数据手套的,另一个是
Web应用系统已成为当前的主流网络应用,为用户提供电子商务、电子邮件、在线新闻、网络社区等类型多样的服务。Web应用具有异构性、分布性、动态性等特征,当前Web应用呈现出规
无线射频识别(RFID)技术利用无线射频信号实现非接触式自动识别,具有快速、可靠、准确及抗干扰能力强等优点,广泛应用于商品识别、公共交通、物流追踪、军事反恐、数字图书馆管
对计算机系统性能的追求是无止境的。计算机系统的性能与编译器等系统软件密切相关。编译器生成的指令类型、数量和排列都会影响计算机系统的性能。随着处理器结构日趋复杂,编
Linux内核发展迅速,已经被应用于多个平台上,但同时对Linux内核的开发和维护提出了更高的要求。为了提高调试和剖视Linux内核的效率,节约时间成本,Linux内核跟踪工具应景而生。Ft
行人检测是车辆自动驾驶系统的核心模块,主要通过安装在汽车上的雷达、摄像头等设备获取道路状态信息,判断车辆行驶前方是否有行人,为车辆自动驾驶过程中报警、自动减速或者紧急
汽车主动安全是一种使汽车在事故可能发生时能够主动采取措施,避免事故发生的技术。盲点探测系统作为汽车主动安全系统的重要组成部分,在车辆进行并道或超车时,能有效降低因视觉
本论文的主要内容是视频图像质量检测技术的研究与实践。视频图像质量的评价方法有很多种,通常从清晰度、色偏、对比度和信噪比等几个方面来衡量,而对图像清晰度的检测是难点
处理器性能一直是处理器设计的主要目标。如何充分开发和利用指令间的并行是提升单核处理器性能的关键。超标量技术是现代处理器设计中广泛使用的技术,它通过多发射、动态调度