【摘 要】
:
说话人识别也称为声纹识别,是利用说话人的声纹特征来辨别说话者的身份,以其自然性、唯一性、易采集性等特点,可广泛应用于需要进行身份验证的各种安全领域、互联网应用领域以及通信领域等。为了提高说话人识别系统的性能,选择最能代表说话人语音特性的特征是非常重要的。本文利用独立成分分析(Independent Component Analysis,ICA)和解析稀疏表示(Analysis Sparse Rep
论文部分内容阅读
说话人识别也称为声纹识别,是利用说话人的声纹特征来辨别说话者的身份,以其自然性、唯一性、易采集性等特点,可广泛应用于需要进行身份验证的各种安全领域、互联网应用领域以及通信领域等。为了提高说话人识别系统的性能,选择最能代表说话人语音特性的特征是非常重要的。本文利用独立成分分析(Independent Component Analysis,ICA)和解析稀疏表示(Analysis Sparse Representation,ASR)来实现有效的语音特征选取。论文主要工作如下:1.利用独立成分分析,提出了一种声学独立分量(Acoustic Independent Component Analysis,AICA)特征选取方法来提取说话人的语音特征。首先利用说话人的语音信号提取不同分辨率的Gammatone系数(Double Gammatone Frequency Coefficients,DGFCs),采用快速独立成分分析(FastICA)构建说话人模型。再利用说话人模型提取独立的DGFCs参数做为目标说话人的语音特征。最后,利用SVM实现说话人识别。该方法在TIMIT数据集上进行实验。实验结果表明,该算法提取具有相互独立性的说话人语音特征,提高了分类器的识别性能。2.利用说话人语音的静态特征和动态特征的稀疏表示,提出了一种用于文本无关说话人识别的长时声学(Long-Term Acoustic,LTA)特征选取的方法。将语音信号分割成相互重叠的语音帧,提取其Mel频率倒谱系数(Mel frequency cepstrum coefficients,MFCCs)。然后将当前MFCCs帧以及其后的连续几帧叠加,构造出一个超级MFCCs帧,从而获取语音信号的静态特征和动态特征。将所有的超级MFCCs帧组合成一个2-D MFCCs特征图(MFCCs features map,MFCCsmap),利用解析稀疏模型构建说话人模型。最后将MFCCsmap的稀疏表示作为说话人的长时声学特征(Long-Term Acoustic,LTA)。利用DNN模型构建分类器,实现说话人识别。实验结果表明,解析稀疏表示有效地提取到了说话人的LTA特征,所提算法能够正确识别说话人。
其他文献
新时代背景下,语文课堂教学越来越重视学生写作能力的培养,然而受中考指挥棒的影响,语文教学支离破碎、读写严重脱离、学生主体意识薄弱等诸多原因造就了学生写作难的现状,阻
随着我国经济发展水平的提高,生态环境恶化问题日趋严重。与此同时,人们生活质量不断提高,愈加难以容忍污染环境的行为,因而要求政府加大环境污染治理的投入力度,提高环境规制的强度。但是,有人担心增强环境保护力度可能会造成企业生产成本上升和大量工人失业,不利于经济发展和就业稳定。就业是安邦定国之策,是人民生活的重要源泉,失业率上升不仅会造成经济增速放缓,还会带来社会动荡等问题。保障就业一直以来都是政府进行
随着现代电子器件以及集成电路的小型化、多功能化、高功率化发展,高效散热已成为量子通信,电子信息和能量存储技术等领域的新兴需求。目前,在聚合物基底中添加无机高导热填
当前,国内外社会安全问题频发,从留美女学生失踪到和颐酒店劫持事件、再到“滴滴打车”软件的数次伤亡事故,使城市居民对自身安全陷入不安状态,也使得保障“家”的安危和提升
随着社会经济的发展,人们的环保意识逐渐提高,更加关注环境污染问题,积极响应国家出台的一系列环保政策,参与环境污染治理。为了从源头解决环境污染问题,需逐步公开环境污染
有机电致发光器件目前在高端显示领域的应用范围不断扩大,在未来极有可能成为显示行业的支柱产品,而其中白光有机电致发光器件因其在固态照明和全彩色显示领域有着巨大的应用潜力,而备受研究者们关注。为了实现白光,研究者们通常采用的方法主要有二元互补色或者三原色叠加这两种方式,其白光发射主要是基于各发光组分之间的不完全能量传递。但是,这种能量传递的程度却很难被精确的控制,这就导致得到的白光色纯度往往不够理想,
巴赫键盘音乐作品是每个学琴者的必经之路,它的重要地位毋庸置疑。这首《意大利协奏曲》(BWV971)是他作品中少有的以协奏曲体裁为主,三个乐章进行的大型器乐作品;既是巴赫少有的键盘独奏协奏曲中较完整的一首,又是萌芽阶段键盘独奏协奏曲的经典曲目。巴赫的音乐创作类型多样化,在巴洛克时期占有重要地位,为后世创作起到启发性意义;这一时期的音乐过渡到不再是只为教会服务的单声部音乐,而是变得多层次有规律可循。演
众包技术允许人们通过众包平台将任务分发给非特定的执行者们完成。而空间众包任务则是指众包任务中与地理位置信息相关的一类任务。空间众包任务通常包含一个任务目标地点,
电子器件的散热问题是限制其发展的瓶颈。喷雾冷却具有散热能力强、质量流量小、温度均匀性好、无沸腾滞后等优点,已成为电子领域备受青睐的散热方式。换热表面微纳米结构改
准确揭示超短脉冲激光加热、微机电等高新技术以及薄膜结构在现代工业中的广泛应用所带来的时间极短、尺度微观的超急速传热过程及其诱发的热-力耦合行为,对于提高激光微加工