ASR与TTS功能在语音增值业务平台中的设计与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:xiaxia28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着增值业务的不断发展和移动用户对内容需求的增大,传统的使用数据业务提供内容的方式己不能满足需求。语音增值业务系统通过以话音为主的方式向用户提供内容。作为语音增值业务系统的核心,语音增值业务平台采用VXML(Voice Extensible MarkupLanguage)这一开放标准语言,给业务内容提供商的语音内容业务提供执行平台,进而建立起全新的“运营商——业务提供商——内容提供商”价值链。ASR(Automatic Speech Recognition)与TTS(Text to Speech)是语音增值业务平台开展语音业务所需的极为重要的媒体资源能力,它们优化了用户与语音增值业务平台的交互手段,提高了服务质量,而且促使了新的业务的出现。 本文对作者攻读硕士学位期间的工作进行了回顾和总结。作者在课题设计期间负责语音增值业务平台中ASR和TTS功能的设计和实现。论文首先分别对语音增值业务系统与语音增值业务平台的概念和结构、ASR与TTS的原理及其标准进行了介绍。接着重点设计了ASR和TTS功能在VAP(Voice Value-added Service Platform)中的一种基于API的实现方案。VAP的TTSC(Textto Speech Client)模块和RN(Resourse Note)模块受控于VXML模块,通过引擎的API与ASR或TTS服务器进行交互来提供ASR与TTS媒体资源。TTSC模块实现文本到语音文件的转换的功能,这种功能适用于对实时性无要求或合成的文本较小的场合。结合TTS引擎API的特点,TTSC模块采用了线程池模式来实现消息的并发处理及资源的动态分配。RN模块在VAP中负责提供各种媒体资源,它由消息分发模块RNManager、资源节点功能模块RNF(Resource Note Function)等组成。RNF模块实现了语音和DTMF音信号的识别及文本的播放,其实现依赖于其它由DSP(Digital Signal Process)语音卡提供的媒体资源能力。论文在对并发处理、实时性、资源协作、资源动态分配等关键问题的分析和解决的基础上,完成了RNF模块的设计和实现。论文分别在NMS和Ddialogic两种语音卡上对RNF模块进行了实现,并对这两种实现进
其他文献
入侵检测是计算机安全领域重要的动态安全技术,也是当前计算机安全理论研究的一个热点。 本文首先阐述了入侵检测的概念、研究现状和分类,比较了几种常见的入侵检测技术。在
随着信息时代的到来,跨语言自然语言处理技术在人们的工作和生活中发挥着越来越重要的作用。其中,实体翻译技术在跨语言自然语言处理任务中有着至关重要的地位。  本文主要研
安全的电子商务协议是保证电子商务活动正常开展的基础。一个貌似安全的协议往往存在安全上的漏洞。模型检测是一种常见的形式化分析方法,在验证电子商务协议时,它的逻辑推理能
在人类发展的历程中,人们从未放弃过对服装穿着舒适及功能性的追求。而着装后的热湿感觉很大程度上影响人们对服装的舒适性的评价;同时,服装的功能性又很大程度上取决于其热湿特
计算机犯罪日益猖狂,传统的以防御为主的安全方案不能很好地应对这一形势,计算机取证技术研究应运而生。本文通过对计算机取证相关理论及技术的研究,具体地分析了经典计算机取证
现今的Web Services技术以服务为目标虽然综合很多优点,但其研究可以说只是对原有技术的一种综合与集成,并不能对服务的智能化进行提升。功能上单一、物理上孤立的软件系统由于
波兰数学家Pawlak于1982年第一次提出了粗糙集(Rough Sets)理论,它是一种新的数学工具,用于处理不精确性和不完整性数据。粒计算是人工智能领域中一个新的研究热点,粗糙集的
网格是继互联网和万维网之后网络发展的第三次技术浪潮。它是一个一致、开放、标准的计算环境的信息基础设施,或者称之为分布式计算平台,它聚合了地理上广泛分布的各种资源,提供
随着科技的进步,计算机产业也在不断发展,信息化早已深入人们的生活。然而,互联网在给人们带来便利的同时,也出现了各种各样的安全问题。传统的安全技术大多处于被动防御的局面,对
在当今纺织服装的计算机仿真应用中,人们已经不再停留于简单的设计和生产,其功能设计和测试已经成为迫切需要考虑的研究问题。应用仿真技术,人们可以观察服装的穿着效果,可以分析