动态贝叶斯网络及其在说话人识别中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:awind54335
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动态贝叶斯网络(DBN)是以概率网络为基础,综合原来的静态网络结构和时间信息而形成的具有处理时序特征数据能力的新的随机模型,具有可解释性、非线性、可扩展性等特性,能较容易的融合新的知识,具有对事物进行完整的表达、推导和学习的能力。DBN本身的理论也尚未完全成熟,现在的应用也非常少,但是它的优越特性以及模型的一般性,已经引起了越来越多的研究者的关注,尤其是在时序数据处理领域。本文针对动态贝叶斯网络本身的理论框架及其在说话人识别中的应用,主要做了下面这些工作: 本文系统地研究和实现了动态贝叶斯网络框架内所必须具备的基础算法,包括静态概率网络下的拓扑转换、交叉树的生成、以及全局概率扩散的算法;同时研究了动态网络推导中的边界算法和邻接算法,实现了动态网络推导的前向后向遍历算法;本文还讨论了DBN中的参数学习和结构学习的几种情况,实现了用于语音处理中的拓扑已知,观测未完全的EM算法。 本文对DBN和HMM进行了拓扑结构上的对比,在介绍几种典型的HMM基础上,讨论了DBN和HMM互相转换的可能性以及如何进行转换的过程,同时比较了两种方法在推导和学习上的差别以及各自算法复杂度的差别,最后给出了实验的证明,说明DBN为什么适合处理语音这类具有很强时序性,而且数据量大的数据集。 本文提出了基于DBN的说话人识别框架,论述了如何通过DBN,对说话人识别的应用进行系统的训练和测试最后,我们通过YOHO语料集的实验测试,把我们的方法跟常规的向量量化(VQ)、单高斯(Single Gaussion)、高斯混合模型(GMM)、隐马尔可夫模型(HMM)进行对比,说明了我们的框架在说话人识别中的优越性,同时也说明了DBN用于说话人这个特定领域的可行性。 最后,本文提出了在数据层、特征层和决策层上,进行基于DBN的信息融合框架。特别的,我们把基音信息和声学特征进行了多种方式的融合,相比于常规的把基音信息利声学特征进行简单组合的方法,性能得到了很大的提高。 尽管作者一直致力于动态贝叶斯网络的研究,但本文的工作仅仅是一个初步,仍有很多东西值得继续探讨。后续工作可以包括研究DBN的近似推导、研究DBN的拓扑学习方法、研究基于DBN的多层次融合方法、多模态融合方法、研究DBN内嵌分类器等等。
其他文献
语义Web(semanticweb)研究的目标是让Web上的信息成为机器可理解的,从而使机器与人能够更好地相互协作,使Web所提供服务的质量得到质的提高.本体(ontology)是目前语义Web研究中
随着网络技术的发展,利用网络进行网上教学便远程教再得到了蓬勃发展的契机。网上教学以网络等各种高新技术为基础,提高教学效果,改进教学方式,增进教学互动。引入人工智能技
粗糙集理论(RoughSet简称RS)是二十世纪八十年代由Z.Pawlak提出的一种新的处理不精确、不确定知识的软计算(softcomputation)工具,而文本挖掘技术是随着互联网的蓬勃发展和电
随着科学、商业以及政府各领域数据库的迅速发展,大量数据的处理问题也迫切需要解决。主要靠人进行数据分析的传统方法,已经不能直接应用于如今庞大的数据分析。人们迫切地需要
线性递归序列的容错综合问题在流密码分析领域有重要着的理论和应用价值。本文利用伽罗华域上的两个变元的多项式F[x,y]的齐次理想刻画齐次关键方程的解空间;说明了利用齐次关
论文以OMG组织的容错CORBA规范为参照。容错CORBA规范的基本思想是通过实现系统的冗余来提高系统的可靠性,论文围绕这个思路进行了相关研究,论文的主要工作包括以下几个方面:
论文针对ERP(企业资源计划)库存控制进行订货点分析需要大量的综合汇总数据的问题,提出建立用于ERP库存控制、分析的ERP库存控制数据仓库系统,采用Excel VBA数据透视表服务建
随着数字信息技术和网络技术的高速发展,嵌入式产业迅速崛起,成为二十一世纪发展最快的IT产业,嵌入式系统蕴含着巨大的市场商机。在这种背景下,已经在服务器市场稳定了地位的Linu
基因芯片的出现为基因诊断和基因治疗提供了很好的前提和可能性,超高维空间超小样本的基因选择问题是基因芯片技术的挑战性课题之一,对于解决维数发难问题和获得诊断基因具有
IPv6协议,作为下一代的因特网协议,已经有了广泛的应用前景。尤其在未来的家庭网络及各类网络小设备中,IPv6在端对端通讯、安全性等多方面比IPv4更具有优势。但目前而言,多数对IP