基于RBM的声纹识别系统设计

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:qq237599512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别属于生物特征识别技术中的一种,在数据安全日益受到重视的今天,正越来越多地被人们所关注。声纹识别和传统识别方法相比拥有很多优势,伪造难、成本低、易接受,语音获取容易,支持远程的认证方式,现已广泛应用于金融、公共安全、智能楼宇等领域中。现阶段的声纹识别模型大多是浅层的网络结构,缺乏对声纹特征的描述能力,也无法解决中文语音的识别问题。在实际的应用过程中,模型鲁棒性差非常容易受到外界噪声的干扰,造成识别结果上出现很大偏差。所以对声纹识别系统的研究具有很重要的现实意义。本文以开源中文语音数据库为研究对象,将受限玻尔兹曼机理论应用于声纹识别系统的研究中,提高了特征参数对中文语音的表征能力,构建了更深层次的网络结构模型,从而提高模型的抗干扰能力,并最终得到适用于中文语音的声纹识别系统。本文在MATLAB R2017a平台上进行开发,算法上对传统的声纹识别系统做出改进,利用软硬结合的方式建立了一种基于无监督学习方法的语音签到系统。主要研究工作内容如下:(1)对语音信号的特征提取方法做出改进。将预处理后的语音信号先用梅尔频率倒谱系数进行初步处理,接着再利用受限玻尔兹曼机网络对提取出的向量进行降维处理,通过重构误差曲线调整网络的结构参数,从而提升特征参数降维后的表征能力。(2)对声纹识别模型的网络结构做出改进,构建深度置信网络隐马尔可夫混合模型的结构框架。从提高标签缺失数据利用率的角度上,利用深度置信网络对特征提取后的语音进行无监督学习,得到更精确的样本数据观察率,再由隐马尔可夫模型完成语音类别的概率预测,比较后得到声纹识别的最终结果。通过设计对比实验发现,使用深度置信网络改进后的模型识别率更高。通过重构误差曲线优化网络的结构参数后,发现网络由3层受限玻尔兹曼机堆叠而成时的识别率更高。(3)搭建语音签到系统的硬件平台。将DE2开发板作为硬件设计的主要平台,由Quartus II软件完成编译。通过开发板上的WM8731芯片对收集到的语音进行模-数转换,再由IS 61LV25616AL-10芯片对转换后的数据存储,用于后续的电脑软件处理。使用S7-200CN构成系统的控制器,由V4.0 STEP 7软件完成控制部分的编译。结合控制器自身的扩展模块完成对语音输入端、出门开关、电锁、门阻、读卡器等模块的综合控制,并为后续的功能扩展预留部分端口。硬件部分添加了额外的继电器控制开关电路,可以确保公司、学校等地方门禁系统在极端环境下的正常运行,实现了声纹识别系统的数字化与智能化。
其他文献
中华文化博大精深,源远流长,跨越了五千年的历史,传统木版年画就是在这片土地中孕育生长出来的一种独特而又灿烂的文化,是传统民间艺术形式之一。河北武强年画地区经过数百年的发展,使这一民间艺术逐步成熟,内容丰富多彩,艺术特征鲜明,不仅具有独特的艺术风格,同时它又承载着当地老百姓对美好生活的祈盼与憧憬,是人们情感的寄托,成为我国传统艺术文化中的宝贵财富。年画的发展更加凸显了我国优秀的民间传统艺术文化内涵和
氧化应激是机体遭受外来刺激后产生大量自由基,导致细胞及组织出现损伤的现象。氧化应激会引起心脑血管疾病、恶性肿瘤、神经退行性疾病、糖尿病等一系列疾病,因此,寻找能有效清除自由基的抗氧化剂对于治疗氧化应激相关疾病具有重要意义。从天然产物中寻找抗氧化先导化合物、并进行结构修饰和优化,是研制氧化应激性疾病新药行之有效的途径。生活在高温、高渗、高压等极端环境、海洋和动植物内环境等特殊环境中的微生物为适应外部
受到专业能力和经验的限制,大多数MTI学生接触较多的是陪同翻译和交替传译。许多学生选择在援外培训项目中做志愿者来提高自己的口译能力。援外培训不仅可以帮助他国专业技术
英国当代作家威尔·塞尔夫(1961-)于2002年出版的作品《道连:一场模仿》是对奥斯卡·王尔德(1854-1900)所著《道连·格雷的画像》的一部致敬之作。王尔德原作糅合了作者鲜明的唯美主义主张,以及哥特式风格和哲学化倾向等,历来吸引着中外学者,并数次被改编,通过文学、电影、戏剧等不同形式延续其强大的生命力。《道连:一场模仿》中,塞尔夫对王尔德笔下经典形象的模仿可谓是一把双刃剑,既迅速引发了评论
随着金融渠道的多元化,尤其是互联网金融趋势的增强,企业融资渠道增多,各大金融机构为争夺市场资源的竞争加剧,银行传统的营销业务已不能满足现代银行业的发展。营销作为银行经营管理的重要组成部分,是扩大经营规模、提高生存能力的核心手段,为了实现山东省Y银行零售金融业务的整体发展,提高其金融市场竞争力,有必要对Y商业银行的营销进展情况及未来策略优化进行深入思考和研究。本文将以山东省Y商业银行零售业务为例,借
表情是人类传达情感的载体,能够最直观的反映出一个人的观点、态度和情绪。随着动画电影、游戏等娱乐产业迅速发展,人们对于虚拟人物表情表现力的需求也在不断提升。其中,基于真实表演者的表情捕捉和表情迁移因其表情的自然性和丰富性而成为主流的解决方案。目前大部分表情捕捉技术需要依赖物理标记点或深度相机,设备要求较高,针对这一问题,本文研究了基于单目摄像机的人脸表情迁移系统,包括三维人脸重建和表情合成问题,给出
跨国贸易和人口流动等全球化要素的出现,既为全人类的健康福祉创造了机遇,也带来了挑战。随着世界各地的联系变得日益紧密,全球卫生形势也正变得日益复杂。因应这种变化,世界各国纷纷开始探索适合本国国情的卫生治理之路。泰国是中低收入国家中开拓卫生治理道路最成功的代表。国内发展和国际推动,被认为是泰国卫生治理获得成功的两个重要因素。其中,国际推动的本质,是国际行为主体参与泰国卫生治理,为其创造有利的发展条件。
各种图像编辑软件的盛行,导致图像篡改越来越方便。图像的取证技术就是用来检测图像是否被篡改,主动取证需要事先在图像中植入数字签名或数字水印等信息,被动取证只需要待检测图像,所以被动取证成为了一大热门研究。同幅图像的篡改较为普遍,因为同一图像中的区域有着相同的光照、阴影,导致肉眼很难辨别出篡改区域。已经有很多文献在此领域提出自己的检测方案,主要分为基于图像块提取特征的检测技术,和基于关键点提取特征的检
本文首先对我国的先行判决制度在适用范围和条件、启动方式以及剩余部分诉讼标的的处理方式等方面存在的问题进行了分析。首先是适用范围偏窄,对于诉的合并审理等复杂诉讼形态下能否适用先行判决缺乏具体规定。其次是关于适用条件的规定不清晰,没有凸显先行判决制度在处理疑难复杂案件方面的功能;其次是剩余部分诉讼标的的处理方式较为混乱,存在由作出先行判决的法院继续审理和告知当事人另行起诉等两种情形;在启动程序方面,没
目的:通过分析精子DNA碎片指数(DFI)与精液常规、精子形态学及体外受精胚胎移植(IVF-ET)/卵胞浆内单精子注射(ICSI)结局之间的关系,探讨精子DFI在评估男性生育力及辅助生殖技