自动语音识别相关论文
互联网时代,视频是重要的数据载体之一,对于非母语者或者有听力障碍的人,字幕可以有效地帮助他们理解视频内容。随着人工智能的迅......
智能设备的普及,让人们越来越感受到语音交互的便利。作为一种非常自然的人机交互方法,自动语音识别自二十世纪七十年代以来一直是......
为了解决非英语母语学习者在语音识别中出现的语法错误问题,提出了基于神经机器翻译的语法错误检测语音识别中的语言模型。将构建的......
随着注意力机制在自然语言处理等领域的成功应用,基于注意力的端到端语音识别吸引了广泛的关注。然而现有的研究主要是应用于英语......
语音识别技术是人机交互应用的基础,在机器翻译机、人机对话问答系统和智能会议实时字幕等系统上具有重要的应用价值。目前,越南语......
随着各种多媒体如语音和图像的使用变得越来越普遍,这些数字多媒体不可避免地带来了通信信息安全性的问题,而信息隐藏技术有望为信......
苏州有线网络智慧广电融合支撑平台,以有线网络AI智能终端为载体,引入语音识别、智能分析等先进技术和互联网生态,设计服务于苏州......
在强噪声的情况下,语音信号的端点检测是一个难题.以前用过的传统算法在这时都失去作用,因此需要寻找端点检测的新方法.本文提出了......
一个语音浏览器系统能够提供更易为人们所接受的网络浏览模式,拓展了Internet的发展空间.分布式语音浏览器能够解决目前语音浏览器......
自动语音识别(Automatic Speech Recognition,ASR)是一种利用计算机将人类的语音转换为文本的技术。近年来,端到端语音识别系统成......
自动语音识别技术和计算机人工智能技术的迅速发展促进了口语自动评分技术及相关软件和应用产品的快速发展。本文梳理了国内外英语......
在强噪声的情况下,语音信号的端点检测是一个难题.以前用过的传统算法在这时都失去作用,因此需要寻找端点检测的新方法.本文提出了......
电话是当前人们使用最为平常的通讯工具之一。Internet网的出现为人们提供了空前巨大的信息资源,如何用电话来使用Internet资源就显......
自动语音识别系统在噪声环境下的鲁棒性是语音识别系统从实验室走向实际应用的关键,其主要研究目的是为了解决应用环境与训练环境之......
本文主要研究的是自动语音识别中的前端噪声鲁棒性问题。众所周知,语音识别的根本目的就是使机器能够听懂人类的语言。在当前的实......
自动语音识别(ASR,Automatic Speech Recognition)是通过机器识别和理解过程,把人类的语音信号转变为相应的文本或命令的技术。语音......
自动语音识别技术(Automated Speech Recognition,简称ASR),它是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它......
唇读是用计算机再现聋人通过唇动破解语言规律读懂语言的过程,这是一项非常具有挑战性的科学发现,同时也可以用作语音识别的一种辅......
视频是集图像、声音、文字等为一体的综合性媒体。随着互联网技术的发展和网络带宽的提升,网络视频数据量呈爆炸式增长,从浩瀚的视频......
本文以作者参与“中鸿讯统一消息服务系统(ZHX-UMS)”设计与开发工作为背景,在讨论有关UMS的体系结构、关键技术和实现方法等方面问......
本文介绍了语音合成技术、文语转换系统的组成及其实现过程;自动语音识别技术、自动语音识别系统的组成及其实现过程;语音应用程序开......
为了降低自动语音识别中深度学习的训练成本,提出了一种有效的基于梯度的主动学习询问策略。主动学习是通过一定算法查询出最“有......
未来通信服务的开发与应用都将朝外包模式发展,且移动通信服务下一代主流应用将是定址化服务、多媒体短信息服务和自动语音识别服......
日本歌乐公司(Clarion,Inc.)开发出世界上第一台车载电脑系统“歌乐车载PC机”(ClarionAutoPC),该项技术综合运用了汽车音响、计算机技术、导航引路技术及基于自动语......
歌乐公司(Clarion)开发出世界上第一台车载电脑系统“歌乐车载PC机
Clarion has developed the world’s first in-car computer......
本文提出了汉语语音导引特征的概念,讨论了语音导引特征在自动语音识别中用于导引匹配搜索的运用方式和重要作用;提出并设计了汉语塞......
适用于自动语音识别的声道参数¥中国科学院声学研究所@俞铁城适用于自动语音识别的声道参数我们听到的语音是由舌、唇、喉等发音器官......
语音的声学特性和音位,并不完全是一对一的关系。说话的人所发一个音,除代表这个音位外,也受其他因素——个人发音特点、语音环境......
语音扩展标记语言VoiceXML的结构模型和核心技术,并对语音互联的核心——语音门户作了详细的分析。
VoiceXML markup language Vo......
计算机语音识别技术已经发展到了一个新的阶段,它能够因人而异, 适应每一位操着不同口音的使用者。系统不仅能听懂,而且还可以与人......
针对大多数IVR流程修改难的特点,提出了利用组件技术、脚本和相应的脚本引擎的方法加以解决,利用该方法可以容易开发出可视化的图......
改革开放以来,随着计算机信息技术的迅猛发展和广泛应用,社会信息化进程不断加快,信息网络的基础性、全局性作用日益增强,语音识别......
在人机交互系统中,自动语音识别(ASR)错误将导致交互障碍,通过发起澄清式人机对话可以实现ASR错误恢复。 本文提出了澄清式人机......
在人机交互系统中,自动语音识别(ASR)错误将导致交互障碍,通过发起澄清式人机对话可以实现ASR错误恢复。该文提出澄清式人机对话系......
为了提高感知线性预测系数(PLP)在噪声环境下的识别性能,使用子带能量偏差减的方法,提出了一种基于子带能量规整的感知线性预测系......
人类对语言的感知是多通道的,人在识别和理解他人说话内容时除了利用听觉来感知信息外,常常还利用了视觉信息如唇动来提高准确性。对......
提高语音识别精度一直是自动语音识别研究领域所关注的核心问题之一。本文分别从单系统以及多系统联合解码方面展开研究,以提高大词......
在过去的40多年间,语音识别在隐马尔科夫模型(HMM)和高斯混合模型(GMM)的框架下得到了很大的发展,在多种应用环境中都取得了较好的性......
近年来,自动语音识别技术的迅猛发展使其可以逐渐在实际商业系统中使用。目前主流的自动语音识别系统在安静的实验室环境中可以取......
自动语音识别技术作为人机交互的重要手段,具有非常重要的研究价值。声学模型作为语音识别系统中最关键的模块之一,对识别性能起着至......
随着自动语音识别技术突飞猛进的发展,基于语音识别技术的产品得到大量商业应用。虽说语音识别技术的广泛使用已经让其深入人心,但是......
将UBM子空间中的说话人MLLR自适应得到的M-矢量应用于SVM中,提出了一种新的说话人确认系统.该系统有效地将扰动属性映射算法整合到......
在朗讯DEFINITYG3交换机上增加网络计费管理平台和语言服务系统可实现 111主叫号码播报、112故障申报、改号通知、114自动总机、11......