多模式语音端点检测

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wangxiaoxiao880523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。 In speech signal processing system, the speech energy detection (VAD) based on frame energy is often affected by the instability of speech energy and the noise. In order to improve the performance and robustness of speech endpoint detection, visual information is introduced. In this paper, the visual characteristics based on data-driven linear transformation are proposed. Two single-mode VAD systems are constructed based on a general VAD-based model. By using the two-step fusion method, a multi-mode VAD system . Experiments show that the multi-modal VAD, which uses both audio and visual information, has a 55.0% relative decrease in frame error rate and a relative decrease of 98.5% in the sentence error rate over the frame-based auditory VAD. This result shows that the multi-mode VAD method can basically avoid the sentence-breaking error and also can significantly improve the frame-detection performance, which is a very effective method.
其他文献
美联储每次议席会议公告中必有一句话“美联储保持宽松立场不变”,2017年12月14日加息之后,美联储公告中同样有着“保持宽松立场”的表述.原文翻译成中文是:考虑到已经实现的
期刊
母爱是不需要理由的.孩子每一点细小甚微的进步在母亲的眼里都是了不起的,我常常惊诧于孩子成长的速度和突飞猛进的认知能力.近几个月来,我参加全国资产评估检查工作,经常出
青年是事业的希望与未来,是行业朝气蓬勃的生力军,是发展壮大中国共产党的后备力量.保持共产党员先进性、切实调动青年党、团员和入党积极分子的积极性,是党务工作求实、务实
这是协会55岁以下青年的合影照和每个人写下的一段话。若干年后,也许他们已不再年轻,但留下的灿烂笑容与肺腑之声将告知大家:为了中国评估行业的发展,岁月虽无情,青春却无悔。
期刊
[摘要]安全是煤矿的永恒主题,干一天煤矿工作,就必须抓一天安全。近年来,在党和政府以及全社会高度重视安全生产的大背景下,煤炭企业安全生产状况有了明显好转。但是,与党和政府的要求、与人民群众的期盼、与西方发达国家的煤矿安全相比,我国煤矿企业仍有差距,事故尤其是零星事故仍然不断,安全生产形势依然不容乐观。如何进一步搞好安全生产工作,结合近年来的工作实际,笔者认为,抓好安全工作,要以人为本,着力提高人的
近年来发现 ,降钙素基因相关肽 (CGRP)除了传统的作用外 ,还对免疫系统起一定的作用。本文通过对 CGRP在人正常淋巴结和淋巴瘤组织中表达的研究 ,来探讨 CGRP在淋巴结中以及
期刊
为探讨可溶性细胞间粘附分子1(sI CAM-1)在血液系统恶性肿瘤中的临床价值,我们采用生物素标记的双抗体酶联免疫吸附试验(ELISA),对49例急性非淋巴细胞白血病(ANLL)和骨髓增生
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊