【摘 要】
:
在信息时代背景下,语音是人们日常生活中最直接的信息传递与交换形式。而现实生活中,多数语音往往伴随着噪声,使人感到舒适度下降。听力受损的人理解不同背景噪声下的语音是
论文部分内容阅读
在信息时代背景下,语音是人们日常生活中最直接的信息传递与交换形式。而现实生活中,多数语音往往伴随着噪声,使人感到舒适度下降。听力受损的人理解不同背景噪声下的语音是很困难的。因此,怎样从信号中分离噪声、改善可懂度以及如何评价可懂度成为了一个重要问题。目前,理想二值掩蔽(Ideal Binary Mask, IBM)技术的提出,给噪声背景下评价语音可懂度提供了希望。最近研究表明每个时间-频率单元对语音可懂度重要性与语音内容相关。时间-频率单元被分为噪声主导和目标语音主导两类。本文实验结果表明每个语音存在的时间-频率单元对语音可懂度的重要性与目标语音的响度有关。2008年,Li和Loizou研究证明,当输入信噪比在-5dB下,误报错误比丢失错误对语音可懂度的影响更大。本实验对输入混合信噪比进行了扩充,研究了不同输入混合信噪比下,两种掩蔽错误对语音可懂度的影响。本文实验证明,当混合信噪比在0dB以下时,误报错误比丢失错误对语音可懂度影响更大。理想二值掩蔽的研究大都是基于这样一个假设:每个语音分离单元对语音整体可懂度的贡献度是一样的,但没有改变IBM结构。考虑到两种掩蔽错误对语音可懂度影响程度和IBM结构对语音可懂度的影响,本文提出了对丢失错误和误报错误进行加权控制的方法,同时结合IBM结构的改变,意在提出更好的评价语音可懂度的指标。
其他文献
随着组播技术的发展,基于组播数据流传输的Internet应用越来越普及,如传感器网络中的数据监测系统以及金融方面的在线数据处理等,因此其安全性也备受人们的关注。组播数据流
多输入多输出(MIMO)系统也叫多进多出系统被认为是下一代高速通信网络中的一个关键技术,它的最大特点是可以在不增加带宽的前提下成倍的提高网络吞吐量。对于多进多出系统的
获取传感器网络节点的位置坐标是无线传感器网络应用中需要解决的基本问题。对于大多数应用,不知道节点位置而感知的数据是没有意义的。可移动传感器节点的位置具有实时可变
随着计算机越来越普遍的融入到人们的生活和工作中,人们对计算机的要求也越来越高。在人机交互方面,人们已不在满足于借助键盘等外部设备向电脑输入命令的形式,而更希望能够
分布式多学科优化设计( Distributed Multidisciplinary Design Optimization,简称DMDO)支撑系统是上海市政府的大型民用客机创新工程的子项目,它为中国商用大飞机项目提供面
随着计算机多媒体技术和网络技术的不断发展,使得数字多媒体(数字图像,数字视频、音频以及三维计算机图形)的应用得到了广泛的发展。数字媒体有着易存储、易编辑,易传输等传
随着网络论文数量的快速增长,如何从大量的学术文献中查找影响力较大的k篇论文已成为数据挖掘领域研究的热点问题。因此,对学术网络影响力的最大化进行研究具有重要的理论意
机器翻译是自然语言处理领域的一个分支,其主要任务是利用计算机将文本从一种语言翻译到另一种语言。在过去的十年里,机器翻译在学术界与工业界都得到了长足的发展。在机器翻
随着当前互联网技术的快速发展,互联网通过其低廉的通讯成本和快速的通讯能力使得企业、学校和政府等部门的组织模式产生了巨大的变化。现在人们更愿意以互联网作为信息交流
模拟法庭是法学专业教学中重要的实践环节。传统的模拟法庭存在着实践活动组织困难、缺少优秀师资和不便监管等状况。为了改善这些状况,构建基于网络的模拟法庭教学实践平台