基于VoiceXML的语音增值业务平台及其算法的研究

被引量 : 1次 | 上传用户:only_xin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前以及下一代网络中,语音业务是最重要的业务,占有非常大的比重,是运营商主要的盈利手段。而语音增值业务的蓬勃发展给运营商带来的并不只是直接的利润,它还提高了现有设备的利用率,更给用户带来了新的语音体验,提高了用户对运营商的忠诚度,吸引更多的用户使用该运营商的网络,也给运营商的其他业务带来了潜在的客户和利润。然而,现有语音增值业务平台的封闭、不灵活、维护困难、业务开展困难等缺点难以根除。随着语音增值业务的发展,用户数量的增加,现有的语音增值业务平台已经不能满足需求,变成了阻碍语音增值业务进一步发展的因素。所以新的语音增值业务平台应运而生,而已经成为语音浏览器的规范的VoiceXML(Voice eXtensible Markup Language,语音可扩展标志语言)具有开发灵活、业务开展方式简单等优点,是新的语音增值业务平台的最佳选择之一。本论文受国家杰出青年科学基金(No.60525110)、新世纪优秀人才支持计划(No.NCET-04-0111)、高等学校博士学科点专项科研基金资助课题(No.20030013006)资助,对基于VoiceXML的语音增值业务平台和其中涉及的一些算法进行了研究。目前,在研究成果的基础上已经完成了一个语音增值业务系统的开发,并且已在多个省份部署,拥有数百万的增值业务用户。论文对研究过程中取得的主要创新成果进行了详细阐述。这些创新工作简要归纳如下:1) VoiceXML语音增值业务平台通过网络来获取VoiceXML业务脚本和业务资源,所以不可避免地引入了网络时延,而电话用户对时延极其敏感。为了解决这个问题,对VoiceXML语音增值业务平台中的预取方案进行了研究,并认为在VoiceXML语音增值业务平台中预取的对象应是VoiceXML业务脚本中引用的业务语音资源,提出了一种自适应多用户共享的Markov预测算法,利用语音增值业务平台可以感知用户是否在线的特点,统一计算所有在线用户下一步所需的资源及其概率,提高了预测的准确率;进一步提出应采用抢占式优先级调度算法对预取任务进行调度,将资源将会被访问的概率映射为优先级参与排队进行预取调度。仿真研究表明,自适应多用户共享的Markov预测算法比目前的单用户Markov预测算法对资源未来的使用概率的预测更加准确,采用抢占式优先级调度模型也能比目前的循环调度模型得到更好的预取效益。两种算法结合可以有效地降低网络时延带来的影响,提高语音增值业务平台的响应速度,减少用户的等待时间。2)为了更好地降低网络时延带来的不良影响,对缓存替换算法作了深入地研究,在分析了现有的若干缓存替换算法后,指出替换算法应该分成两个关键问题,其一是确定资源的效用函数,其二是替换过程的算法。针对第一个问题,改进了LRU-K(K-Least Recently Used,K阶最近使用)算法并提出了新的效用函数PLRU-K(Perfect LRU-K,完美的LRU-K);对于第二个问题,根据0/1背包原理,提出了采用一阶优化贪婪替换过程(1-optimal Greedy Replacement Process,1-GRP)算法对缓存进行替换选择。仿真结果显示,PLRU-K的效用函数要比LRU-K、P-LFU(Perfect Least Frequently Used,完美的最少使用)效用函数更能体现缓存资源未来的使用收益;1-GRP算法要比P-GRP(Profit-based Greedy Replacement Process,基于收益的贪婪替换过程算法)、PD-GRP(Profit-Density-based Greedy Replacement Process,基于收益密度的贪婪替换过程算法)更能让缓存获得更大的收益;基于PLRU-K和1-GRP的缓存替换算法的性能要超过其他的替换算法,特别是在缓存空间较小的情况下。3)为了避免缓存中的VoiceXML文档及资源与服务器上的原件不一致而将过期的数据提供给用户,缓存的一致性控制算法不可或缺。本文讨论了在Web环境中,在不对HTTP(HyperText Transfer Protocol,超文本传输协议)及Web服务器进行任何修改的前提下,如何更好地实现缓存一致性控制的问题。在分析了目前一致性控制算法的优劣的基础上,考虑到VoiceXML文档的特性,根据Web文档修改时间间隔满足负指数分布这一结论,提出了随机分布拟合预测算法,使用参数估计的方法来拟合VoiceXML文档修改时间间隔的随机分布,再通过此分布预测VoiceXML文档改变的概率,用以指导是否应使用缓存内的文档。仿真研究表明,使用随机拟合分布预测算法能得到小于0.01%的文档过期率,基本满足电信系统中呼损率的要求,同时能获得较大的性能提高。4)针对VoiceXML中不能直接提供多方通信控制功能的问题,提出对VoiceXML的object元素提供的功能进行扩展;在讨论了多方通信控制所需要的具体功能之后,提出了阻塞式和非阻塞式两种不同的object扩展方案并分析了各自的优劣,还举例说明了如何使用这些object。5)在电话会议的应用中,混音是一个关键的问题,而目前的混音算法都没有很好地克服混音后音量忽大忽小变化的问题。在分析了目前的混音算法之后,提出了非均匀波形收缩混音算法,该算法基于在语音信号中低强度信号比高强度信号出现几率更高的事实,采用与混音路数无关的恒定混音权重进行混音操作。同时该算法不需要进行乘除法操作,没有浮点运算,容易采用硬件实现。实验证明,该混音算法效果理想,混音后的语音自然流畅,没有噪音,在多路语音输入时仍能保证语音质量,并且是目前最快的混音算法之一,完全能满足语音会议中高性能、高并发的混音要求。本论文的研究成果不仅可以用于基于VoiceXML的语音增值业务平台中,对于其他语音增值业务平台和相关领域的研究也具有很好的参考价值。
其他文献
吕叔湘先生和中小学语言教育──联系实际、为社会实际服务的语言科学家的一代宗师张志公编者按:吕叔湘先生是德隆望重的语言学专家,又是语文教育改革的卓越的倡导者。吕先生从
槲寄生Viscum coloratum(Kom.)Nakai是桑寄生科槲寄生属植物,在我国分布广泛,尤以北方资源丰富、品种单一。现代药理学研究表明,该属植物具有抗肿瘤、抗心律失常、抗病毒、抗氧
目的:应用聚维酮碘与利凡诺对DFUs进行干预,观察二者清除伤口浅表微生物,即对伤口表面微生物载量的影响,旨在进一步评价二者在糖尿病足溃疡换药方面的效果,以便选择控制DFUs
目前,污水处理厂的平流式二沉池都普遍存在着流态不善的现象,这种现象最终会导致沉淀效果和沉淀效率的下降。本文首先用CFD模拟软件FLUENT对平流式二沉池内的流态进行模拟,分
尾部相依性与金融市场间的风险紧密相联系,鉴于传统研究方法存在低估或高估市场间相依性的可能,提出了多机制平滑转换混合Copula模型,从极值风险视角出发考察了中国A、B、H股
试论教学策略的基本涵义及其制定的依据西南师大张大均,余林教学策略是目前教学问题研究中的新热点之一。"教学策略"一词已广泛用于教育文献之中,但目前教育理论界对教学策略的涵
从微观层面分析货币市场与资本市场的联结问题,通过构建支持向量机(SVM)和Copula函数的集成系统,研究金融市场联结途径与形态结构,深层次挖掘两个市场互动的规律.针对金融时
<正> 李桂云同志是著名的河北梆子艺术家。她善于把她优美动听的唱腔和精湛的表演艺术融合起来,使之更有效地刻画人物,抒发人物感情。李桂云早年就开始创制新腔,运用北京语音
目的:胰岛素抵抗是2型糖尿病的重要组分,肥胖特别是腹部脂肪堆积促进胰岛素抵抗的发生。本研究旨在以应用双能X线(DEXA)准确测量体脂含量及分布为评价手段的基础上,分析体重指数
像商品市场一样,金融市场要受到市场机制的影响,并主要通过价格发挥作用而决定金融产品提供者的规模、利润以及市场竞争地位。我国加入WTO后,市场利率的不断走低迫使商业银行