计算机语音信号处理与语音识别系统

来源 :南京邮电学院学报 | 被引量 : 0次 | 上传用户:gen19gu86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对10个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性(主要是短时帧能量、短时过零率和帧能量差),并把它们应用于语音端点检测,为系统的建立做了基础准备。选用了语音信号的功率谱差的特征,进行了模板的建立与识别实验。测试结果表明,该系统性能较稳定,单个数码字识别率可达98.6%,说话人识别率
其他文献
一、创新焦虑“去年(2005年7月29日)看望钱学森时,他提出现在中国没有完全发展起来,一个重要原因是没有一所大学能够按照培养科学技术发明创造人才的模式去办学,没有自己独特的、
拟声不仅是一种构词法,而且也是一种重要的修辞手段。英语中有大量的拟声词,它们大多来自于模仿自然万物的声音,呈现出灵活性、广泛性、形象性、创造性等特点。在翻译时,可以
近期,工业和信息化部网络安全管理局会同北京、上海等通信管理局积极开展调查,先后组织对上海携程商务有限公司、深圳市腾讯计算机系统有限公司、上海洋码头网络技术有限公司、
在简要介绍了遗传算法的基础上,通过引入种群早熟集和种群多样度的概念,分析了遗传算法中过早收敛现象的起因与特征,阐明了杂交过程的成熟化效应是引起遗传算法过早收敛性的主因
王红睿,1980年7月出生,男,吉林长春人,工学博士,副研究员。2003年7月获吉林大学自动化专业学士学位,2006年7月获吉林大学控制理论与控制工程专业硕士学位,2009年7月获吉林大
提出一种基于全局视觉优化的视频目标检测算法,在原有流引导特征聚合算法(FGFA)基础上,更关注寻找检测精度与运行时间之间的折衷策略。首先利用全局视觉优化的思想,使用感知哈希算法在多帧特征聚合前进行帧段两端的全局视觉相似度计算,判断当前帧段的时序信息相关性;其次使用连续帧作为输入,进一步利用视频的时序信息,将相邻帧在运动路径上的特征聚合到当前帧的特征中,进而对视频特征有更好的表达。ILSVRC实验表
本文介绍了灰色系统理论中GM(1,1)模型的建模方法,并用该方法建立了江苏省1988年和1989年邮电业务中函件总量、邮包总量、汇票总量、长途电话总量的预测模型。1988年的预测精
小波变换在语音处理中有广泛的应用,但是传统的阈值函数存在不连续且在临界阈值处不能平滑过渡等缺陷。针对这些缺陷,提出了一种改进的小波阈值函数,同时在获取阈值时采用贝
2018年7月22日-23日,中国电子与宁夏银JlI市签署战略合作协议。根据合作协议,双方将按照产业生态发展理念,重点围绕电子信息、新材料、信息安全等产业方向,构建信息服务、健康医