广播音频分割与聚类技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:samuraitruong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和互联网技术的广泛应用和深入普及,多媒体数据的数量正在飞速增长,广播音频数据作为多媒体数据的重要组成部分,其信息量也在不断膨胀。如何有效地对音频信息进行组织和处理成为现代信息处理的一个研究热点。   音频数据仅仅是一种简单的没有任何语义符号的数据信息的集合,但是音频的种类是庞大的,如何从中提取出能够标识各自类别的主要特征信息,是音频处理前最为关键的一步。当音频信号在类型发生变化的时候,其声学特征会有明显的差异。音频分割就是利用这些差异性,将音频信号分割成为长短不一的音频片断;音频聚类技术可以将“杂乱无章”音频片断集合按照一定的类别区分开来并加以注释,以方便人们的使用。本文在研究前人工作成果的基础上,重点研究了音频分割和音频聚类技术。   首先,针对T2-BIC分割算法累积误差较大、召回率不高的缺点,设计了一种改进的T2-BIC二级分割算法。第一级采用改进的滑动窗口来检测搜索窗中的T2统计量峰值,利用BIC准则对峰值进行确认;第二级用分步解决的思想来处理由于BIC置信度过低而漏选的分割点,从而提升召回率。该算法不仅降低了计算量,而且召回率和综合性能都有所提升。   其次,鉴于传统的基于BIC的“自底而上”的层次聚类算法对音乐等信号聚类结果呈离散态的不足,设计了一种基于小波域的BIC多层次聚类算法,利用主成分分析消除信号特征向量中的冗余信息,采用Dmey波帧平均熵值来处理音乐等信号的聚类工作,对于类别集合中存在的剩余孤立点,利用GLR距离进行迭代归类操作。与其它音频聚类算法相比较,该算法提高了聚类的精度,使聚类类别结果更加细化。   最后,设计了包含特征提取、音频分割和音频聚类关键模块的音频检索分析系统,方便了科研工作者对音频的分析处理操作。
其他文献
近几年,随着GPU的计算能力和访存带宽的提高,GPU计算已经成为了近代信息处理领域一项非常重要的技术。CPU的串行计算架构日益成为高性能计算性能提升的瓶颈,而GPU已成为当前
学位
轨迹聚类是将相似的轨迹分组,是分析运动轨迹数据的一项非常重要的技术。实际上,大多数聚类算法都面临两个具有挑战性问题,即选取合适的轨迹间距离度量方法和确定最优的聚类
遗传算法是一种借鉴生物界自然选择和进化机制而发展起来的高度并行、随机、自适应的优化搜索算法。排课问题是学校教务工作的重要内容之一,课表的编排是一个复杂的多目标优
对当前的存储系统及设备,能耗和实际应用程序的性能逐渐超越简单的硬件特性成为重要性能评估指标之一。这主要表现在两个方面。其一,随着硬件和电力开销的上升,系统及设备的功耗
虚拟现实技术随着它不断的发展与完善,它在我们社会、学习和生活的每一个领域都得到了极其广泛的应用和发展,重要应用之一就是数字化虚拟校园系统。该系统可以为我们提供一个
相对于CPU计算能力的提高、网络带宽加大,存储设备的发展已经跟不上计算机主要部件和网络发展的速度,以至于存储设备已经成为现代基于云计算的计算机系统的瓶颈。伴随着基于
随着人类社会的飞速发展,许多复杂性、非线性、庞大系统等方面的问题大量呈现在人们的面前,传统的优化方法已经逐渐陷入了困境。这时,自然界中那些群居的简单生物表现出来的复杂
图像引导放疗(IGRT)是在三维适形放疗和调强放疗出现之后,刚刚兴起的又一种精确放疗技术。它充分考虑了患者在治疗过程中和分次治疗间存在的各种误差,利用各种先进的图像引导设