说话人自适应相关论文
尽管近年来,语音识别技术在说话人无关的任务上取得了很大进步,语音识别的识别率也得到了显著的提升,但是由于训练过程中的数据与......
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成......
隐马尔科夫模型(Hidden Markov Model,HMM)是当前连续语音识别领域应用最为广泛的声学模型,但HMM基于的语音帧之间相互独立的假设......
该文针对汉语广播电视新闻语音识别的技术难点,主要进行了以下几个方面广泛而深入的研究.首先:在广播电视新闻语音的连续语音分割......
该论文回顾了汉语连续语音识别的基础知识,包括隐含马尔可夫模型、语音特征参数的提取、声学模型、语言模型、识别过程和汉语的声......
鸡尾酒会问题,即在一段同时有多个说话人的语音中追踪和分辨每一个说话人的语音,是语音领域中最重要的问题之一。尽管自动语音识别......
随着深度神经网络在大词汇连续语音识别中的应用越来越广泛,基于深度神经网络架构的语音识别系统也逐渐成为人们研究的重点与热点......
设计了一个基于关键词识别技术的股票查询系统.该系统采用连续隐马尔科夫模型(CHMM)框架,对词表内的关键词和词表外的非关键词分别......
语音识别技术的研究和发展带动了许多产业的发展,它使人和机器的交流变得更自然、更方便、更灵活。用于激光扫描语音控制系统的研究......
汉语连续语音识别的研究已经进行了十多年,取得了一定的成果,但仍然有许多重大的技术问题亟待解决。首先,声学模型的鲁棒性和准确......
随着航海技术和计算机技术的快速发展,船舶导航自动化程度越来越高,但是船舶导航系统警报大都还采用机械式的声响,海员需要用肉眼......
经过几十年的研究,语音识别技术取得显著进步,在无噪声、朗读发音等特定条件下已经走向实用。然而,在面临低数据资源、噪声干扰、说话......
在未来的文语转换(TTS)系统中,合成语音的个性化将是一个备受关注的目标.说话 人自适应的韵律建模方法,无疑将是影响合成语音自然......
该文主要针对非特定人语音识别系统识别率不够理想的缺陷,研究了部分比较实用的说话人自适应算法,并且主要针对以离散隐马尔可夫模......
该文共分5章讨论.第一章介绍计算机语音识别的现状和发展前景.第二章介绍HMM模型和基于该模型的参数重估算法.第三章介绍HTK实验工......
非母语口音、少数民族语口音是汉语普通话连续语音识别应用中必须面对的问题,论文研究民族语口音普通话的口音识别和语音识别。论文......
本文提出一种新的说话人自适应方法 :最大后验 (MAP)估计与最近邻线性回归 (NNLR)结合的自适应 ,利用模型近邻信息和MAP自适应结果......
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提......
交通广播中存在着多个说话人,本文讨论利用说话人聚类技术解决MLLR对自适应数据在量和文字标注上的要求,提高关键词识别率,实验证......
在基于语音学决策树状态聚类时,包含不同数量捆绑状态的决策树对应不同的复杂度.通过研究模型的复杂度对系统性能和说话人自适应的......
提出一种利用自适应语料和训练语料对模型状态结构调整的算法。该算法在易混淆的状态间参数共享,提高了模型对样本的后验概率和对......
语音识别技术中说话人快速自适应技术受到普遍关注.最大似然模型插值(maximum likelihood model interpolation, MLMI)算法是一种......
为了降低语音识别系统中噪声的影响,提出一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待......
提出了一种最大后验 (m aximum a posteriori,MAP)估计和加权近邻回归 (weighted neighbors regression,WNR)相结合的说话人自适应......
为了克服噪声对语音识别系统的影响,提出了一种基于主曲线的说话人自适应方法,这种方法可以通过一组主曲线描述所有状态的特征统计......
说话人自适应是提高非特定人语音识别系统识别性能的有效手段,本文针对非母语说话人,结合常规的自适应技术MLLR和MAP,探索云南纳西......
本文提出一种新的说话人自适应方法:最大后验(MAP)估计与最近邻线性回归(NNLR)结合的自适应,利用模型近邻信息和MAP自适应结果,建立线性回归模型,对没......
本文提出了一种新的说话人自适应算法———最大似然模型插值。其基本思想是 ,利用语音单元间的相关性 ,根据最大似然准则由一组说......
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体......
该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较......
计算机已渗透到生活的各个角落,计算机的普及化、家电化、各种类型的计算平台都需要更简便的输入媒体,语音当仁不让成为用户最佳的......
该文根据云南境内少数民族同胞说普通话时明显带有民族口音的语言使用现状,介绍了一个以研究非母语说话人汉语连续语音识别为目的......
语音识别系统在实用环境中的鲁棒性是语音识别技术实用化的关键问题。鲁棒性研究的核心问题是如何解决实用环境语音特征和模型与干......
说话人自适应技术是提高说话人无关语音识别系统性能的有效手段。本文主要介绍了说话人自适应技术中的模型参数自适应,并通过实验研......
介绍了说话人自适应技术中的特征语音(Eigenvoice,EV)方法。用最大后验概率特征分解(Maximum a Posteriori Eigen-decomposition,MAPE......
提出了一种随机段模型系统的说话人自适应方法.根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中.在“863......
提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice,EV)自适应方法基础上,进一步在音子空间寻找低维子空......
提出了特征空间本征音说话人自适应算法,该方法首先借鉴RATZ算法的思想,采用高斯混合模型对特征空间中的说话人信息进行建模;其次......
声道归一化是语音识别中说话人自适应的方法之一,在噪声环境下对其进行了研究并做了一系列的实验.在实现过程中,首次在噪声环境下......
本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象。为此......
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参......
近年来,深度神经网络(Deep Neural Network,DNN)技术在语音识别(Auto Speech Recognition,ASR)领域的应用快速发展,已经成为了ASR......
采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型DHMM孤立字语音识别系统中,采用了3种说话......
语音识别系统在实用环境中的鲁棒性是语音识别技术实用化的关键问题.鲁棒性研究的核心问题是如何解决实用环境语音特征和模型与干净......
针对语音识别中快速说话人自适应问题,对已有的说话人支持权重算法进行改进,利用支撑向量机(Support Vector Machines,SVM)参与支持说话......
该文讨论了不同非母语条件下的语音识别说话人自适应问题,提出了说话人分类和声学模型合并两种不同的自适应方法,并用实验说明了所提......