基于FPGA的说话人识别系统的设计与实现

来源 :东北大学 | 被引量 : 1次 | 上传用户:judge119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别作为一种生物识别技术,能够根据测试语音来辨别说话者的身份。在实际应用中,说话人识别技术以其独特的方便性、经济性等优势受到世人的关注,在信息安全和身份鉴别领域都有着广泛的应用前景。目前,针对说话人识别系统的研究主要集中在算法的鲁棒性和实现平台上。MFCC(Mel Frequency Cepstrum Coefficient)利用了人耳听觉原理和倒谱的解相关特性,具有对信道失真的补偿能力,因而被广泛的应用于语音相关的识别任务中。基于矢量量化的识别算法具有较高的鲁棒性,算法相对简单,是文本相关识别的主流算法之一。当前已有的说话人识别系统大都基于计算机软件或者以DSP(Digital Signal Processor)为核心平台。随着数据库的不断增大和算法复杂度的提升,系统的实时性等要求将面临着巨大的挑战。本文重点研究算法的实现平台,从而有效地解决了系统实时性问题。本文针对实时性问题提出了一种以FPGA(Field Programmable Gate Array)为硬件平台的解决方案。该方案以MFCC为语音特征,采用了基于矢量量化的说话人识别算法。系统主要包括语音信号采集、端点检测、特征提取、码本训练和识别判断5个部分。语音采集模块通过I2C总线完成了对WM8731语音编解码芯片的控制;端点检测模块设计并实现了基于短时能量和短时过零率的双门限算法;特征提取模块完成了MFCC系数的提取,设计并实现了按时间抽取基2的FFTIP核和以2为底的取对数IP核;通过LBG算法完成了码本的训练;识别判断模块实现了基于平方误差欧氏距离测度的矢量量化识别算法。系统的硬件实现采用Verilog HDL语言,在设计过程中运用了乒乓操作、流水线设计和模块复用等手段,充分发挥了FPGA高速、并行运算的优势。最后,在友晶科技公司的DE2-35开发板上进行调试、验证。经测试证明,该系统完成了文本相关的说话人识别系统的基本功能。在实验室条件下,当系统时钟为50MHz时,完成一次4码本系统的识别耗时15.932ms;12码本系统的识别率为93.3%。该设计提高了系统的识别速度,是一种解决实时性问题的有效方案。
其他文献
随着片上系统(SystemonChip)芯片规模、复杂度和功能的不断增加,验证所花费的时间不断增加,远远超过了设计所需的时间,对验证的投入也越来越多,传统的验证方法已经不能满足项目进
目的对血淤型颈椎间盘突出症患者采用刺络拔罐结合推拿治疗效果进行分析和讨论。方法选取我院2016年5月~2017年3月接收的血瘀型颈椎间盘突出患者58例为研究对象,按照单盲、平
移动通信技术发展迅速,在人们日常生活中扮演着越来越重要的角色,移动通信频段电波传播特性研究已经成为当前电波传播领域的研究热点。隧道是常见的交通环境,对隧道内移动通信频
本文在界定好产业转移的相关概念基础上,利用区域间投入产出模型建立了定量测算区域间产业转移的方法,并结合中国区域间投入产出表,测算了中国1997—2012年间三个时间跨度的
小额信贷一直是商业银行难以有效发展的业务。随着互联网技术的发展,出现了小额信贷与互联网相结合的新型小额信贷模式——P2P网络小额信贷。在该模式下,资金的使用者与供给
班组是县级供电企业(以下简称“企业”)最基层的组织单元,是企业各项工作的落脚点,也是企业安全稳定、和谐发展的基础。加强班组建设,意义重大,应以提升班组管理水平、提升班
随着语音识别技术的不断发展,如何提高各种发音形式的语音识别率成为这方面技术的主要解决问题。比起连续词语音识别技术,孤立词的识别更需要精确度较高的端点检测和模板匹配
水利施工项目质量不仅是一项系统化、复杂性的工程,也是和群众切身利益相关的工程,只有确保其施工质量才能促进社会和谐稳定发展。为此,本文就水利施工质量安全影响因素进行
目的 探讨改良灌肠技术联合清胰汤灌肠对重度胰腺炎患者炎性因子和氧化应激水平的影响效果。方法 选取2017年5—12月我院收治的90例重度胰腺炎患者作为研究对象,随机将其分为
目的探讨丹参酮胶囊联合恩替卡韦对慢性乙型肝炎肝纤维化患者乙型肝炎病毒(HBV)-DNA转阴率及肝功能的影响。方法选取我院收治的慢性乙型肝炎肝纤维化患者68例,随机数字表法分组,