音频分类算法研究与实现

来源 :上海大学 | 被引量 : 0次 | 上传用户:jiangshan1017
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,人们有机会接触到大量的多媒体内容。由于多媒体数据量的快速增长,对多媒体内容的分析和分类变得越来越迫切。作为多媒体数据中标志性部分的音频数据,为人们的感知提供了重要的信息内容,因而音频信号处理在多媒体信息处理中占有重要地位。 近年来,由于话者分割在音频检索、说话人身份鉴别和自动跟踪等方面的广泛应用,众多学者在说话人分割方面做了大量研究。话者分割,是根据语音波形中反应说话人生理和行为特征的语音参数,自动分割出说话人改变点的过程,它是音频信息处理研究领域的一个重要研究方向,具有广泛的应用前景,得到人们越来越多的重视。 区别于一般用能量分割静音的方法,本文采用一种新的似然比特征去除低信噪比环境中的噪声,提高了系统的鲁棒性。同时,由似然比特征,导出了一种新的特征参数--似然比交叉率,该特征能很好的表征语音和音乐间的差别,这个特征也适用于其他低信噪比环境。 文中对传统的贝叶斯话者分割算法存在的问题进行分析,提出了一种新的改进型贝叶斯话者分割算法。该算法基于贝叶斯准则确定初选改变点,对其端点的变化趋势做进一步分析,得出说话人改变的分割点。 支持向量机是在统计学理论上发展起来的一种模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势,同其他模式识别方法相比主要有两个特点:一是它采用非线性核函数来表示特征空间的内积,另外它采用分类间隔最大的最优分类超平面实现结构风险最小化原则。由于支持向量机具有坚实的理论基础,得到越来越多的研究,并在各个领域中得到了广泛应用。 通过用支持向量机学习方法对音频数据进行分类,本文对不同参数组合下的分类精度进行了比较,并分析了参数对分类精度、支持向量个数及分类时间的影响。进而提出了如何确定参数以提高分类精度并减少分类时间的新方法。
其他文献
无线局域网与传统以太网相比,具有移动灵活、易架设、易维护、抗干扰性好、保密性强等优点,能够满足各种便携式设备的接入、计算机局域网的远程接入,实现声音、图文以及电子邮件
随着移动通信技术的发展,人们在享受它给我们带来便捷的同时也对其提出了更高的传输速率和质量的要求,为了实现未来无线移动通信系统的高数据速率、高频谱效率、高覆盖范围等
本文研究基于像素法的目标CAD建模与RCS分析计算。在定义目标的CAD网格外形数据的基础上,通过面元上各像素点的z缓冲算法生成目标的像素级消隐外形,利用物理光学法(PO)对像素
农药残留造成的对农产品的污染进而影响到人类的生活质量问题,已成为全国乃至全世界关注的焦点。因此对农药残留的检测,有十分重要的意义。本论文分析了目前有关农药残留量检
在多层砖混结构的住宅中,设置构造柱,并与墙体可靠连接,作用是提高房屋的抗震能力,增加房屋的整体刚度和延性,延长方能给我的使用寿命,所以规范对构造柱的设置作出了明确规定,但在施工中发现构造柱质量存在很多问题,有些已形成通病,给工程留下了质量隐患。本文叙述构造柱的质量通病及其处理方法。    一、质量通病产生的原因  1、构造柱设置部位和数量不符合规范要求,出现漏设和少设现象,如变形缝两侧的浅谈没能视
期刊
随着计算机网络的飞速发展,网络安全问题越来越引起人们的广泛关注,并成为当今网络技术研究的重点之一。保障网络安全最大的挑战之一就是能否及时准确地发现漏洞,而绝大部分
摘要:随着当今社会的不断发展和人民生活水平的不断提高,生产和生活中对各种建筑物施工过程以及施工质量的要求也日益渐高。因此,积极采用科学的建筑施工技术、不断完善施工技术管理就成为当前一项十分紧迫的问题。特别是随着近年来由于施工技术管理不到位,而引发的建筑工程质量问题不时发生,这无疑更应该为我们关注施工技术及其管理活动敲响警钟。本文通过对当前建筑施工技术管理,进行分析,并提出了改进施工技术管理的种种对
期刊
智能视频监控技术是模式识别的一种,它利用一些计算机的算法,分析、提取和识别视频内运动目标的行为特征。在大约五十年的研究与开发中,目标跟踪已经大量的应用于视觉导航、
近年来,无论是发达国家还是发展中国家,都毫无例外地受到了不断恶化的交通的困扰。交通视频监控系统通常由摄像机、图像采集卡和计算机等部分组成并模仿人眼功能进行监控,是21世
20世纪80年代初由Lewis B.L.等人提出的由频率调制导出的P3、P4多相码是一类常见的编码脉压信号,和线性调频信号相比,不需要接收端加权,即可获得低的自相关函数旁瓣电平;和二相编