语音自动切分技术的研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:CRP0538570914
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音自动切分技术成为语音信号处理领域的一个研究热点。由于手工的语音切分方式存在着耗时耗力并且不具有一致切分结果的弊端,为此,寻找一种高效的自动切分方法显得及其重要。   在充分考察目前汉语语音自动切分技术发展现状的基础上,本文着眼于连续语音的自动切分这一难点问题,进行了深入的研究。本文将声韵母作为切分的基本单元,提出了基于层次的自动切分方法,并使用Matlab进行了实现。   基于层次的连续语音自动切分方法包含三层切分,经过研究和对比,每一层选择一个最适合此层的切分方法:第一层是基于信息熵的语音段检测,利用语音信号的信息熵对连续语音进行切分,得到每个逗号分隔开的短句,这层切分只是语音信号一个初步的端点检测,用信息熵足以达到切分要求,并且信息熵在端点检测方面较传统的短时能量和过零率等方法有着更好的鲁棒性;第二层是基于最小相位群延迟函数的音节切分,即对短句切分出每个音节,由于语音信号短时能量的最小相位群延迟函数的波峰对应音节的切分点,所以此方法避免了门限的选择,比选择门限进行切分的方法效果更好;第三层是基于共振峰能量参数的声韵母切分,即将每个音节进行声韵母的分离,采用共振峰能量参数作为声韵母切分标准是因为一个音节的主要能量集中在元音上,而元音的共振峰频率有其特定的范围,共振峰能量对于声韵母具有良好的分辨率。   本文提出的语音自动切分方法主要针对汉语连续语音的切分,将三种不同类型测量量应用在不同的切分阶段,实现汉语从句子到声韵母基元的切分。实验结果表明,本文所使用的方法对于语音切分行之有效,正确率达到94%,具有良好的切分效果。
其他文献
随着互联网技术的飞速发展,越来越多的数字内容开始在互联网上传播,数字内容服务已经成为互联网行业中发展最快、最有前景的领域之一。但是,数字内容通过网络传播时极易被非法获
随着云计算技术的推广,涌现了许多优秀的云计算平台,其聚合了大量硬件资源和软件资源,并采用虚拟化技术实现动态伸缩服务量,按需提供服务。为确保云平台正常运转,必须对整个云架构
随着信息技术和互联网的发展,基于流式数据的应用越来越多,传统的计算架构已经无法满足这类应用的需求。本文针对于基于数据采集和在线统计分析等Web应用的现实问题,设计并实现
随着信息科技的不断进步,智能手机设备正日渐普及,移动互联技术也在飞速发展,强大而丰富的手机应用功能为人们的日常生活、学习和工作带来了极大的便利。   在这之中,Android
P2P流媒体应用是目前网络应用研究中的热点之一,数据调度作为P2P流媒体系统设计中的一个关键性问题得到了广泛的关注。目前现有的相关P2P流媒体数据调度策略大多是在请求节点
随着现代网络存储技术的不断深入发展与广泛应用,网络集群服务与主机多路径技术成为信息系统容灾与安全解决方案中的两种重要核心技术。本研究课题将利用微软MPIO多路径框架
随着科学科技的发展,尤其是信息化进程的不断加快,计算机及互联网在人们日常生活中发挥的作用越来越大,普及率也越来越高。计算机在各方面给人们带来便利、高效率的同时,计算机及
分子模拟计算在当代化学、生物学及制药学等科学领域的研究中扮演着不可替代的作用。通过分子模拟计算可以大大缩短这些学科的研究周期,同时极大地提高其实验成功率。现今主流
蛋白质的三维结构决定其生物功能,拓扑是对蛋白质结构的高层描述。预测蛋白质的核心拓扑模式,不仅有助于解构蛋白质三维结构,而且有助于设计和改造药物结构。本文面向蛋白质结构
Web服务是下一代面向服务计算的有效解决方案,而在开放、动态的网络环境中,服务自身行为的真实性无法确定,导致组合后的质量难以得到保障,所以如何评估Web服务的可信度,以及