语音半自动标注系统的设计与实现

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:zd013wyt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当代信息技术日新月异的发展,人们对语音合成和语音识别的效果提出更高的要求,越来越多的实验室研究成果被应用到实际生活中,各种语音系统产品不断问世。构建大规模的语料库是设计优秀语音系统不可缺少的一项任务,而是否对语料库进行精确标注,则决定语料库质量的优劣,因此语料库的标注在语音研究中起到关键性的作用。大量的人工标注不仅耗时、耗力、成本大,而且由于人耳对于词或语句中单个音节的边界不敏感,标注数据会产生较大的误差。论文设计了一个语音语料的半自动标注系统,能够自动计算出语音语料的边界和基频包络,在此基础上手工矫正自动标注结果,实现语音语料边界和基频包络的准确标注。论文的主要工作与创新如下:1.实现了语音基元边界的自动标注算法。对录制好的无时间标注语音文件,采用基于隐Markov模型(Hidden Markov Model,HMM)的强制对齐算法进行时间边界的自动对齐。在HMM模型训练过程的重估步骤中,引入了确定性模拟退火期望值最大(Deterministic Annealing Expectation Maximization,DAEM)算法,提高了语音基元边界强制对齐的准确性。2.实现了语音基频的自动标注算法。在语料时长边界标注的基础上,采用STRAIGHT(Speech Transformation and Representation based on Adaptive Interpolation of w eighted spectrogram)算法提取语音的基频,并对提取出的基频数据进行平滑。根据两峰值点距离是基频周期的关系,获得峰值点标注位置,从峰值点形成的基频包络曲线,可以直接发现漏标、错标的峰值点。通过人工修正,得到更加准确的标注数据。这也就是半自动标注系统的体现。3.设计实现了一个语音半标注系统。系统采用图形化用户交互界面,在语音波形上画出每个语音基元的边界,同时将STRAIGHT算法的基频,转换成语音波形上的峰值点标注。在此基础上,设计实现了手工修改语音基元边界和峰值点标注的功能,以完成更为精确的语音基元边界以及基频包络的标注,最终实现可视化的语音半自动标注系统的设计。4.对兰州方言进行了实验语音学分析。利用实现的语音半自动标注系统,标注了兰州方言单字的边界和基频,并进行了实验语音学分析,验证了兰州方言单字的语音学结论。
其他文献
和人类一样,动物是地球上的珍贵生命,关爱动物,与动物和谐共存,是社会发展、人类文明的重要标志。孩子.与动物有着天然的近乎灵性的亲近,他们对动物世界的理解、对动物朋友的爱心是
期刊
目的评价MRI动态增强鉴别乳腺良恶性肿瘤和病理分级的作用。方法回顾性分析我院2012年1月1日至2014年12月31日期间经病理证实行影像学动态增强MRI检查的患者85例,选择第1个动
文章导入汽车的外部成本这一核心概念,运用福利经济学中关于社会成本和外部性的理论,就小汽车的负外部性,尤其以小汽车造成的大气污染做重点分析。以武汉市为例,运用人力资本
古往今来治水在中国都是极为重要的公共事务。中国古代的治水,大体有三件事情最为重要:防洪、农业灌溉和漕运。当代中国治水的内容包含了越来越多的方面,干旱缺水、水污染和
工具材料:餐巾纸、小水盆、各色水粉颜料、水粉笔、苍蝇拍等。  范例:美丽的花。