基于扩展型双线性变换法的耳语音转换为正常语音的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:sclin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音是人类交流的主要方式之一。耳语音转换技术涉及信号处理、人工智能、模式识别、声学等学科领域,是一个典型的交叉学科的产物。对耳语音转换方面的研究工作有较高的科研价值。受国家自然科学基金项目“耳语讲话中的语音增强与耳语音-正常语音转换研究”的资助并作为该课题的部分内容,本文在对耳语音转换算法如线性预测法、同态信号处理法、线谱对定值偏移法、径向基函数神经网络法等基础上,提出了基于扩展型双线性变换法的耳语音转换为正常语音的算法,主要工作包括:针对传统算法对汉语耳语音端点检测以及声韵分割点检测正确率不高导致耳语音转换系统性能下降的问题,本文根据语音信号的非线性特性和希尔伯特-黄变换的性质,提出了基于希尔伯特-黄变换瞬时能频值的耳语音端点检测算法与声韵分割算法以及基于经验模态分解熵值的耳语音端点检测算法,有效提高了检测的正确率。针对耳语音在不同频段的共振峰偏移程度不同,本文将耳语音的频谱进行分段处理,在此基础上建立的耳语音转换函数更加精确。针对耳语音在各频段内频率为非线性偏移的问题,本文在双线性变换函数中引入扩展因子,使其对频谱的非线性搬移与对共振峰带宽的压缩更加符合耳语音转换为正常语音的实际转换需求,有效减小了转换语音与正常语音的谱失真距离。综上工作,本文设计了一个耳语音转换为正常语音的系统。实验结果表明,本文的转换语音在音质和可懂度上均得到了有效的提高。最后,提出了算法的缺点及未解决的问题,给出了进一步研究和改进的方向。
其他文献
风力发电系统是一个复杂的非线性、多变量、耦合系统。为了获得最大风能,本文提出了变论域模糊自适应控制与矢量控制相结合的控制策略。首先在分析风力发电机组工作原理的基础上,根据坐标变换理论建立双馈异步发电机在两相旋转坐标系下的数学模型;然后分析其输出机械功率和转速的特性关系,建立了变速恒频风电系统最大风能捕获的控制系统。最终提出了变论域模糊自整定PI功率控制策略,此方案减少了论域的设定以及模糊规则的设定
集散控制系统(DCS)广泛应用于工业过程控制中,控制系统要求能够迅速反应当前的生产状态,数据采集和输出控制一般是短暂有效的,如果出现报警事件、设备故障等,要及时通知到监
学位
随着分布式计算学科的发展,专家和学者逐渐从对单体机器人的研究,扩展到对多机器人的研究。多机器人系统具有容错性好、鲁棒性强、稳定性好等优点,故多机器人系统在军事、航
数字多媒体和网络通信的发展使数字信息的存储、复制和传播变得简单,但随之而来的数字产品版权保护、信息安全、真伪识别已成为正待研究解决的问题。数字水印技术因其透明性
在我国火力发电厂的运行过程中,不可避免的需要使用大量的柴油或重油等,油料易挥发有害气体,很容易导致人员中毒,甚至引发火灾事故,其后果不堪设想。电站燃油库是储存易燃、
多机动目标跟踪问题是目标跟踪领域的一个重要研究方向,在空中预警、战场监视等军事领域,以及空中交通管制、导航系统等民用领域都具有广阔的应用前景。随着科学技术的飞速发
ESP系统(Electronic stability Program,电子稳定程序,在欧洲称为ESP,而在美国和日本则称为VDC,vehicle Dnamics Control,即车辆动力学控制系统)是德国Bosch公司1995年推出的
根据视频统计现场人数并进行自动引导,是智能视频监控新的应用趋势。近年来,以上海世博会为代表的大型会展的兴起为智能引导系统(IGS)的发展提供了契机。人们开始思考如何在
空压动力和制氮系统在煤矿生产中有着举足轻重的作用,其中煤矿空压动力系统担负着全矿风动工具和卸煤设施的动力供给任务,制氮系统用来防止危险发生,隔离有害易爆气体,用于井下防