基于长时平均频谱的“文本无关”话者识别

来源 :声学技术 | 被引量 : 0次 | 上传用户:my_code
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章在动窗离散傅立叶变换为基础获取说话人的长时平均频谱(即短时频谱的长时平均),然后将长时平均频谱经过能量归一化和频率归一化后作为“文本无关”话者识别的语音特征。分析之前,语音样本经过频域预知权和时域汉明窗加权处理,并利用帧能量门限自动去除了样本中的寂静段。通过在小人群范围内对该方法的大量实验,得到很好的话者识别效果。另外,作为“文本无关”话者识别的一个重要辅助手段,文章还利用短时频谱分析给出了话者语音样本的窄带三维语图和宽带三维语图,它们能清晰地给出话者语音的时变频率特征。
其他文献
玉米的病虫害很多,在玉米的不同生长时期都可能发生病虫害,在防治的时候,一定要充分了解病害产生的原因和特点,有针对性的进行防治,才能收到良好的效果,确保稳产高产。
为进一步挖掘玉米后期增产潜力,切实提高单产水平,确保玉米丰产丰收,玉米适期晚收技术是一项比较有效的技术措施,因为在玉米收获期正是光照充足、昼夜温差大,最有利于玉米灌