基于BTSM-LDA的口形动态特征及多流异步音视频语音识别

来源 :数据采集与处理 | 被引量 : 5次 | 上传用户：ys13920715

【摘要】

：

引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余。同时采用一种新颖的多流异步动态贝叶斯网络(MS-ADBN)模型来实现音视频的连续语音识别,该模型在词节点级别体现了音视频流的同步异步性。识别实验结果表明:采用LDA视觉语音动态特征的系统性能明显优于静态的口形轮廓

【作者】

：

吕国云赵荣椿蒋冬梅 H. Sahli 樊养余 W. Verhelst

【机构】

：

西北工业大学计算机学院,布鲁塞尔自由大学电子与信息处理系

【出处】

：

数据采集与处理

【发表日期】

：

2008年04期

【关键词】

：

动态贝叶斯网络语音识别贝叶斯切线形状模型多流异步线性判别分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

2-巯基嘧啶对锌在磷酸溶液中的缓蚀研究（英文）

通过失重法研究了 2 -巯基嘧啶对锌在磷酸溶液中的缓蚀作用 .结果表明缓蚀剂对锌在磷酸溶液中有较好的缓蚀效果 ,缓蚀作用是由于缓蚀剂在金属表面形成保护膜 ,且未改变腐蚀过

期刊

腐蚀锌2-巯基嘧啶酸介质corrosionzinc2 - mercaptopyrimidineacidic media

复合硅酸盐钻井液体系室内研究

对复合硅酸盐钻井液作了详细的室内实验研究 ,包括 :与常用钻井液和钻井液处理剂的配伍性 ,配方研究 (膨润土含量 ,护胶剂PTV加量 ,pH值 ,降粘手段 ,加药顺序 )和应用性能评

期刊

硅酸盐复合硅酸盐钻井完井液配方研究室内性能评价粘度控制抑制性作用机理

PVT筒中气液两相非平衡过程的数值模拟

目前国内外多采用平衡后各组分逸度系数相等的平衡判据来描述两相中各个组分的分配情况,但该法无法进行两相由非平衡初始状态达到平衡状态这一非平衡热力学过程的研究.针对这

期刊

两相非平衡过程数值模拟PVT筒分离变量法

基于语音特征比较的蒙古语标准音测试系统研究

在蒙古语标准音的水平测试过程中,人们对测试结果存在一些分歧.为了消除测试结果的这些分歧,提出了用基于语音特征比较的蒙古语标准音测试软件来辅助测试的思路.通过对输入的

期刊

蒙古语波形共振峰标准音

适合胜利孤东油田的聚合物/无机铝弱凝胶体系及其试应用

孤东注水开发油田层内、层间矛盾严重 ,注入水和注入聚合物单相锥进 ,注聚井常发生堵塞。为此 ,研制了微凝胶调驱体系 :聚合物 (日本三菱公司的MS35 0 0 ,M =1.9× 10 7,HD =

期刊

弱凝胶胶态分散凝胶聚合物/无机铝盐/油田污水体系深部调剖/驱油现场先导试验胜利孤东油田

可调谐TEA CO-2超辐射激光器初步研究

通过实验对可调谐TEACO2超辐射激光器的特性进行了研究,从理论上对此超辐射的输出强度、线宽和脉宽进行了粗略估算与分析。 The characteristics of tunable TEACO2 superlu

期刊

可调谐 TEA CO-2超辐射激光器放大自发辐射

对聚苯树脂炭化产物作为锂离子电池碳电极材料的研究Ⅱ.炭化产物制备的电极材料组装的锂离子电池电化学性能

测试了对聚苯树脂碳电极组装的锂离子电池电化学性能. 结果表明, 碳电极充放电不可逆性随炭化处理温度升高而逐渐降低. 1 000和1 300 ℃炭化处理的样品与620 ℃处理的样品相

期刊

对聚苯炭化锂离子电池电化学性质

FBG传感器量测混凝土表面应变

采用一种新型FBG应变计量测钢筋混凝土柱在受压过程中的表面应变,并与常规应变片量测方法进行比较.通过机械固定法将FBG应变计安装于立柱表面,并考虑温度对测量结果的影响,最

期刊

光纤Bragg光栅传感器受压柱应变

基于主成份分析的仿射不变特征图像匹配方法

从理论和实验上分析比较了尺度不变特征图像匹配方法和仿射不变特征图像匹配方法的异同,为提高图像匹配的速度和图像特征描述的准确性,提出了一种利用主成份分析对仿射不变特征匹配特征描述向量降维的方法。实验结果表明该方法能加速仿射不变特征图像匹配方法,在不降低匹配效果的前提下,将128维特征向量降低至15维。

期刊

主成份分析尺度不变特征变换仿射不变特征图像匹配

10 kV馈线终端的抗干扰性研究

10 kV馈线终端工作环境恶劣,电磁干扰严重,其运行的可靠性和抗干扰性至关重要,在对电力系统中最典型的几种干扰源的产生机理、频谱特征和耦合途径进行分析的基础上,对馈线终

期刊

抗干扰可靠性馈线终端

基于BTSM-LDA的口形动态特征及多流异步音视频语音识别

与本文相关的学术论文