数字音频的音调和时长变换及压缩效果的研究和实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:zhangchenlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文在研究、总结现有的Pitch/Time Scale处理技术基础上,提出了基于频域处理的Pitch Scale技术和改进的SOLA算法,给出了实现方法;对Pitch Scale升调处理过程中出现的问题给予分析,使用低通滤波器进行了滤波,达到了很好的效果.谈到数字音频,就很难回避音频压缩.压缩方案的选择与否关系到存储空间的节省、网络传输速度的快慢以及音频质量等问题.在选择压缩方案时,首要问题就是选择什么样的压缩格式,压缩方法的好坏直接关系到压缩后音频的质量,特别是象Pitch/Time Scale这样的处理,因为我们在做Pitch/Time Scale等处理的时候,再好的算法本身也会存在缺陷,经过这样处理的音频再经过压缩,效果肯定要受到影响.该文要研究和解决的问题就是Pitch/Time Scale处理后音频压缩的效果问题,该文在详细介绍目前几种主流的音频编解码算法的基础上,对Pitch/Time Scale处理的音频进行压缩处理,对压缩的结果给出了主观上的评价,给出了压缩方案的选择.该文作者参与开发的数字音频工作站(Digital Audio Workstation)DAW的功能十分强大,目前已在日本两家知名电视台中应用,其中Pitch/Time Scale处理就是其中关键技术之一,Pitch/Time Scale处理技术在DAW中的应用极大的增强了DAW的音频处理功能,该文介绍了DAW和其强大的编辑制作功能.数字音频工作站目前多是基于微软的WINDOWS平台实现,可以直接对WAV文件的波形进行编辑处理,如拷贝、插入、删除、淡入淡出等,如果选择了压缩进行保存,那么再对音频进行编辑处理时,所选择的压缩格式是否支持象WAV文件的编辑处理.例如,如果我们选择了MPEG的音频编解码技术,那么后期的编辑处理该如何进行?该文的最后,给出了将WAV文件作为中间转换格式的解决方案.
其他文献
随着电子信息技术迅猛发展,信息存储逐渐成为计算机科学技术研究的重要领域。存储虚拟化系统是指通过将具体的物理存储设备和服务器操作系统相分离,在广域网范围内将零散分布
本文结合了目前问答系统研究领域国际最新研究趋势和作者的实践探索结果,将答案抽取算法分为答案搜索、答案匹配与评分和答案验证三个子模块分别进行了较详细的论述。首先对答
随着DNA分析技术的发展与应用的不断深入,DNA数据的存储与访问日益成为关注的焦点。一般应用系统采用现有的数据库系统来进行管理,数据库系统区别于其它系统的重要方面之一是DB
随着互联网技术的飞速发展,HTML语言本身所具有的弱点,使得其已不能满足WEB越来越广泛的应用,XML可扩展标记语言是专门为Web应用设计的一个简单的SGML的子集,既克服了HTML的不足,
本文以一个大型医院系统集成平台的开发为背景,将工作流的技术用于应用集成当中,首先阐释了企业应用集成与工作流之间的关系,提出了工作流应用于企业应用集成中遇到的若干问
软件测试是软件质量保证的关键元素,并代表了规约、设计和编码的最终评审.一方面,软件系统作为系统元素的可见性不断增加,而且软件故障带来的代价太高,使得人们注重于规划良
入侵检测具有监视分析用户和系统的行为、审计系统配置和漏洞、评估敏感系统和数据的完整性、识别攻击行为、对异常行为进行统计和审计、自动地收集和系统相关的补丁、使用诱
随着社会的发展,机器人应用领域正在不断扩展,从自动化生产线到海洋资源的探索乃至太空作业等领域,机器人可谓是无处不在。以往对机器人的研究大多是在已知、结构化环境中进行的
J2EE体系包括JSP、Servlet、EJB、Web Service等多项技术,这些技术的出现给电子商务时代的Web应用开发提供了一个非常有竞争力的选择.随着J2EE技术的逐渐成熟,越来越多的框架