基于循环神经网络的藏语语音识别技术研究

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:liaoyongsheng123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人与人之间最直接、自然和快捷的信息交互方式,在人们的日常生活中扮演着重要的角色。语音识别(Speech Recognition,SR)技术作为人机交互的核心技术之一,其目标是让计算机通过自然语言理解把语音信号转换成相应的文本或命令的过程。语音识别的研究在实现语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等方面具有重要的理论意义和实用价值。随着神经网络技术的发展,利用上下文信息对长时语音的相关性进行建模的循环神经网络已经成为当前主流的技术。藏族作为我国古老的少数民族之一,有着悠久的历史、灿烂的文化,其语言文字是中华文化的重要组成部分,是藏族与其他兄弟民族文化交流的桥梁。近年来,汉语、英语的语音识别取得了丰硕成果,相关方法和技术可望成为藏语语音识别的枢轴。循环神经网络能挖掘输入特征中的有效时序信息,增强特征的区分性能和表达能力。在处理连续的、与上下文相关的任务(如语音识别)时,它比传统的神经网络具有更大的优势。因此,本文从藏文的文本、声学特征、建模单元的选择等方面入手研究基于循环神经网络的藏语语音识别系统。首先,通过分析藏文文字的特点,研究了藏文文本预处理方法、藏文字符向量表示,以及藏语语言模型。其次,采集了与文本对应的语音数据,研究了藏语语音特征提取方法。结合藏语语音的特点,以音素为建模单元,通过建立输入语音和输出序列之间的概率映射关系研究了藏语语音识别声学模型。最后,以TensorFlow为框架开发藏语语音识别系统,并通过标签错误率和损失值对不同超参下的实验结果进行评测。实验证明,在封闭语料的测试下基于循环神经网络的藏语语音识别取得良好效果。
其他文献
随着经济全球化进程的加快,会计国际化趋势越来越明显,特别是随着经济一体化发展的需要,国内银行业要求与国际银行业接轨,实现我国金融体系的进一步完善,以促进市场化程度的
在消防部队的灭火救援训练中,实战化训练环境对于提升灭火救援能力、提高消防工作质量具有重大意义。本文对我国消防部队在实战化训练环境中开展灭火救援训练的情况进行了分
<正> 作血痕予试验,过去均用联苯胺法。但由于联苯胺是致癌物质,有些国家已禁用。据报导,用4—氨基比林、氨基安替比林等药物取代联苯胺,效果良好。我们参阅有关资料,经反复
本报5月28日讯(记者刘常俭 实习生康瑞珍)我省采取有效措施控制雾霾天气已提上省人大常委会的立法层面。今天,提交省第十二届人大常委会第二次会议审议的省气象灾害防御条例草
会议
汇率制度选择在国际金融和发展经济学中占有重要的位置,关系到国家宏观经济能否稳定运行。近年来,国内外学者纷纷展开该领域的研究。本文对该领域的核心文献进行了梳理和评述
海绵城市建设过程中,根据城市所处区域的地形地貌、地质条件等特点,选择适宜的海绵城市设施类型是其关键问题之一。本研究以某航空港海绵城市拟建片区为研究对象,在广泛收集
种植土-碎石绿化带是海绵城市道路雨水入渗的重要组成部分。为分析种植土-碎石绿化带雨水入渗能力,将负孔隙水压力与相对渗透系数和体积含水率之间的关系简化为指数函数,利用
随着经济迅猛发展和日益增加的能源消耗,建筑行业作为能源消耗的大户,节能已经是全球热议的话题。对于过渡季节,很多办公建筑广泛采用自然通风方式。建筑中人员开窗行为对建
目的:观察针刀神经触激治疗腰椎间盘突出症的临床疗效.方法:将77例腰椎间盘突出症患者随机分为针刀神经触激组38例和针刺组39例.针刀神经触激组,采用针刀松解配合神经触激,每周