论文部分内容阅读
海南省成为经济特区至今31年以来,深入挖掘自身优势,凭借经济特区、国际旅游岛以及生态环境这三面旗帜飞速发展地区社会经济。海南省的第三产业总产值占比逐年提高,其中旅游业对第三产业总产值的贡献非常大,旅游人数持续不断增长,旅游收入表现优秀,但基于小部分限制因素,仍具有很大的提升空间。重要原因之一是语言不通带来的文化差异,尤其是海南是座岛,其方言独具特色,外来人士难以学习,因此限制了来岛人士在海南的发展。语音识别技术正是缓解这一问题的重要手段。本文基于大量针对海南方言的研究,选择海南使用人数最多的方言海南闽语作为研究对象,选取最具有代表性的字词建立海南方言语料库,并借助方言发音的研究设计了海南方言发音词典,然后邀请志愿者参与方言语音的录制,经语音切分后,进行加噪、速度扰动等语音增强手段增广语料库数据,最后建成了第一个海南方言语音语料库。随后,本文基于当前比较流行的语音识别技术即联结时序分类,对比了不同长短时记忆网络以及深度前馈序列记忆网络在海南方言语音语料库上的表现,使用表现最好的深度前馈序列记忆网络作为本语音识别系统声学模型建模方法,初步搭建了一个基于深度学习的海南方言语音识别系统,验证了深度学习在海南方言语音识别中的可行性。