基于多流动态贝叶斯网络的音视频连续语音识别

来源 :西北工业大学学报 | 被引量 : 5次 | 上传用户:kmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对说话时发音和口形的异步问题,提出了一个多流异步动态贝叶斯网络(DynamicBayesian Network,DBN)模型,以实现基于音视频特征的连续语音识别,在这个模型中,音频流和视频流在词节点同步,而在词节点之间,音视频流有各自独立的拓扑结构以及节点变量之间的条件依赖关系,同时词转移节点变量由音视频流共同确定,模型在词级别上体现了音视频流的异步性。采用连续数字音视频数据库的实验结果表明,在信噪比为0~30 dB的测试环境下,比较单流DBN模型和多流隐马尔可夫模型,平均识别率分别提高了8.68
其他文献
目的 研究不同剂量丙泊酚用于门诊无痛胃镜检查时对认知功能的影响。方法 选择胃镜检查患者40例,随机均分为A、B两组。两组患者均在胃镜置入前静注芬太尼1μg/kg,3min后A组静注
带状疱疹(herpeszoster)目前治疗方法较多,各有优点。但尽快消除疼痛,加快疱疹消退,减少带状疱疹后遗神经痛(postherpeticneuralgia,PHN),仍然是治疗中的主要问题。我院从2007年1月至2
目的:探讨品管圈活动在提高ICU护士床头抬高依从性中的作用。方法本次品管圈活动主题确定为提高ICU护士床头抬高依从性,根据自行设计《ICU护士交接班时床头抬高依从性观察表
针对并联机构化为一组代数方程组后符号求解过程的复杂性,研究了并联机构运动学正问题程式化的求解方法。应用代数学中的李特一吴方法,将并联机构运动学正问题转化为一组多项式
目的分析两种顺苯磺酸阿曲库铵用于腹腔镜麻醉临床效果。方法选取我院收治的腹腔镜胆囊切除手术患者共88例,随机将其分成观察组和对照组各44例。采用肌松监测仪对患者拇内收
采用前瞻性单盲随机对照研究。选取普胸外科临床有效病例157例,分为对照组和术后第1d~第7d皮下注射低分子肝素(LMWH)的试验组。观察患者术前和术后凝血酶原时间(PT)、活化的
目的观察改良喙突入路臂丛神经阻滞的可行性。方法60例ASAⅠ或Ⅱ级上肢手术患者随机均分为喙突法组(A组)和腋路法组(B组),A组在喙突尖向内下2cm处绝缘针垂直于皮肤进入,B组取腋动脉
设计并完成了用于自主水下航行器(AUV)导航控制软件的开发与系统测试的半实物仿真系统。该半实物仿真系统由实时仿真计算机和真实的导航控制计算机构成,实时仿真计算机完成AUV空
遥感图像融合过程中,为了在增强空间分辨率的同时减少光谱损失,文章提出了一种改进的强度-色调-饱和度和小波的融合算法,新算法在原算法中,引入正则化技术。以小波域局部高斯模型作为光谱分布先验概率,以全色图小波系数做为空间分布先验概率,以马尔可夫随机场描述空间特征,通过梯度下降法迭代优化,实现了光谱和空间信息总损失最小的图像融合。对美地球资源卫星5的增强专题图像的融合试验证明文中提出的算法可同时提高多光
目的研究氯普鲁卡因用于小儿骶管麻醉的可行性与安全性。方法62例在骶管麻醉下行下肢或会阴部手术患儿(3~8岁),随机、双盲均分为氯普鲁卡因组(研究组)和利多卡因组(对照组),每组31例。