论文部分内容阅读
随着通信技术的发展,出现了多种多样的通信方式,从基本的固定语音电话、移动电话到短信、彩信、音频会议、视频会议等,互联网的发展也使的即时消息(IM)、点击拨号(CTD)等业务逐渐被人们接受。用户希望实现随时随地、使用任何设备和网络进行自由沟通,尤其是企业用户希望能将各种通信能力和企业的办公设施进行无缝地融合,从而优化工作流程、增强企业的对我服务能力。语音处理技术是融合通信系统中的一个重要部分。本文提出了融合通信系统中一种新的语音处理技术,语音处理与语音终端分离,通过服务器.客户端的方式实现融合通信中的语音处理。主要的工作内容包括:
设计了语音系统模块,给出了语音系统模块的架构图,简述了系统模块中各个部分的功能。根据系统的功能,对实现系统功能所需的实现技术进行了研究,包括ORTP协议栈,ActiveMQ消息队列管理服务,Microsoft Speech API(SAPI),以及套接字通信技术。
实现了融合通信语音系统模块中各个部分。从语音系统模块的总体实现出发,实现了语音处理模块,IVR系统,ActiveMQ服务器。语音处理模块的实现过程中,说明了采用的函数库:SAPI的安装与配置,研究了使用其实现文本.音频转换的过程,以及采样率的转换。IVR系统的实现过程中说明了用到的API:ORTP函数库的添加,研究了使用ORTP函数库实现IVR系统接收用户按键信息的过程。ActiveMQ服务器实现了包括服务器的安装与使用,消息队列管理过程,如何向其发送消息以及如何从其接收消息的过程。
实现了语音系统模块的与其他模块的交互过程。实现了从语音处理模块如何通过ActiveMQ服务器发送音频文件给IVR系统的过程,实现了实时合成的音频文件可以播放给终端用户。举例说明了终端用户通过语音系统与核心服务模块进行交互的过程,介绍了交互过程的每一步,包括流程,交互过程中需要调用的函数等,实现用户获取个人信息。
给出了融合通信语音终端测试平台的搭建过程以及给出语音系统模块的测试,分析了测试结果,音频文件的播放和IVR系统接收按键的RTP数据包。