语音信号模块化预处理技术探究

来源 :中国信息化·学术版 | 被引量 : 0次 | 上传用户:wzy_shun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一、语音分析方法
  语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特性的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。
  (l)时域分析方法
  语音信号的时域分析就是分析和提取语音信号的时域参数,是一种比较直观的分析方法。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理与分类等,其实现简单、运算量也较小。
  (2)频域分析方法
  从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等。常用的频域分析方法包括傅立叶变换法等。因为语音信号是一个非平稳过程,因此适用于周期、非瞬变或平稳随机信号的标准傅立叶变换不能用来直接分析,而应该用短时傅立叶变换进行频谱分析,相应的频谱称为“短时谱”。
  (3)同态分析
  同态分析实现了将卷积关系变换为求和关系的分离处理,即解卷。对语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成与识别等。
  (4)线性预测分析
  线性预测分析的基本思想是:由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。现代语音编码的声道模型参数估计大多都基于线性预测分析方法。
  二、语音预处理模块分析
  实用语音预处理系统主要包括噪声消除系统、电平控制系统和回声控制系统等。噪声消除系统的作用是检测并降低语音信号中的背景噪声,提高语音的纯净度;电平控制系统则能稳定信号传输电平,使双端或多端语音的音强与音质维持在一定的水平上;回声控制系统则针对扩声系统中回声所引起的正反馈放大现象,采用自适应滤波等方法进行回声对消,也起到提高语音纯净度的作用。
  下面介绍语音预处理的几个重要模块。
  2.1自动电平控制
  对于经过通信传输或者放大系统的语音信号幅度经常发生很大波动这种现象,ALC系统通过实现一种优化语音信号电平的方法,提高语音质量。自动电平控制(Automatic Level Control,ALC)与自动增益控制都是为了把信号电平调整至最优值,但前者主要用于语音信号处理上;传统AGC则是连续地调整系统增益以控制传输信号幅度。
  ALC系统是建立在语音激活检测(VAD)基础上的实时调整语音信号电平的技术。首先,根据语音信号的短时平稳性,将语音信号分段处理。利用语音帧之间的相关性,计算出当前帧与相邻帧的长时功率值,再与预设值作比较得到增益值,用这个值调整当前帧的电平。由于人的语音信号是不连续的,存在非语音帧的情况。如果不考虑语音帧和静音帧的分类,直接计算增益值,就会将噪音信号帧作为参考计算进去。但背景噪音与语音信号间没有必然的相关性,这样直接计算反而会引起语音信号的不稳定。
  所以在自动增益控制之前加一个VAD检测部分,先将语音信号分成两类,语音帧和静音帧。再以归类为语音帧的信号作为参考计算长时功率值与一个标准值进行比较调整。如果遇到静音帧则可忽略,利用其前一个语音帧作为下一个语音帧的调整参数。调整趋势图如图1,结构图如图2。
  参考文献
  [1] 王炳锡.变速率语音编码.西安:西安电子科技大学出版社,2004.
  [2] 陈克安,曾向阳,李海英编著.声学测量.科学出版社,2005.
  [3] 刘海滨.非平稳环境下基于人耳听觉掩蔽特性的语音增强,信号处理,vol.19,No.4,2003.
  [4] 蔡凌云等.自动增益控制技术应用.电子工程师,2002,28(4):22-23,37
  [5] 刘秀琴.非平稳环境下的谱减法语音增强算法.吉林大学硕士学位论文.2005年
其他文献
个性化档案信息服务作为档案部门特色服务的进一步深化,它以全新的理念冲击了传统服务思想,有利于档案信息服务工作向更深、更广的方向发展,并为档案部门的生存与发展开辟了
档案教育培训工作是为档案事业提供智力支持和人才保障的一项工作。众所周知,一项事业的开展,一项工作的进行,关键在人。人的工作能力和水平是推进事业和工作的关键。档案教
档案开放与利用是档案工作的永恒主题,其中涉及到的一个重要的环节就是协调和处理对含有隐私档案的保密和利用的关系问题。如何在档案保管机构和用户之间、在保护公民隐私权
送端口之间的距离长短,适当地控制载波输送流程,保证电子信息交换处理的稳定性。用于长距离电话通信的载波通信系统,是按频率分割进行多路复用的通信系统。它由载波电话终端设备、增音机、传输线路和附属设备等组成。其中载波电话终端设备是把话频信号或其他群信号搬移到线路频谱或将对方传输来的线路频谱加以反变换、并能适应线路传输要求的设备;增音机能补偿线路传输衰耗及其变化,沿线路每隔一定距离装设一部。  4、接力通
SSL,即Secure Sockets Layer,指的是安全套接层协议层,是由Netscape公司首先提出,适用于WEB应用的一种安全协议,SSL协议建立了一种分层机制,对在TCP/IP协议和应用程序协议之间传输数据的安全性进行分层,SSL协议为通过TCP/IP连接的数据进行服务器认证、数据完整性认证、可选客户机认证和数据加密,保障数据通信的安全、稳定和完整,SSL记录协议、密钥更改协议、握手协
网络环境使档案信息资源开发模式发生了重大变革,对档案信息资源的开发利用工作产生了深刻的影响,实现了档案信息资源最大限度的社会性共享。因而,探索网络环境下档案信息资
导言:我的网络生活现在是2004年,我刚满13岁。我发现上学有点枯燥乏味。无论是在家里还是在学校,我总是禁不住把大量的时间花在网上……网上的信息太丰富了,我可以查阅最新的
【摘 要】通信网络是服务于社会信息传输的平台,其采用多功能控制系统为主导,配合专用的软硬件装置,为广大用户提供了信息处理服务。与传统电话通信相比,现代通信网络更加偏向于网络化,这标志着通信行业科技的创新改革。本次分析了现代通信网络结构模块的优化设计,提出了新型网络应用需注意的相关问题。  【关键词】现代通信;网络结构;模块;优化  【中图分类号】TP391.8【文献标识码】A【文章编号】1672-
军队院校外事档案是记录军队院校在承办或参与的对外友好交往、留学生培训、学术合作、科研合作、人才交流等活动中直接形成的具有保存价值的文字、图表、声像及实物载体材料
据报载,沈阳市中山中学出台了“学生罢免教师”的“新举措”,班级要不要某个老师,学生说了算。如果一个班级有三分之一的学生认为某个老师不合格,那么,这个老师就会在三天之