海量音频数据管理系统

被引量 : 0次 | 上传用户:haihaiboyfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于图像、视频等多媒体数据检索技术相对于文本信息检索技术相对落后,多媒体数据的迅猛增长并没有带来多媒体数据应用的大量出现。事实上,现如今市场上的多媒体应用大多只是实现了数据的存储功能,对于数据的检索实际上只是在多媒体元数据上应用文本信息检索的技术。基于内容来管理和查询的多媒体应用屈指可数,如谷歌的“以图搜图”上线至今仅数年。直到目前为止,基于内容的音频数据检索仍是研究热点。与此同时,海量音频数据的可扩展存储同样是一个有价值的研究方向。由于这两个需求都是在互联网数据急剧膨胀的今天很现实的问题,本文对海量音频数据的管理——包括存储和查询——进行了研究,并实现了一个可用、可扩展、低延时的海量音频数据管理系统。首先,本文改进了HDFS的数据存储策略,使得系统中海量音频原始数据和特征数据的存储能够实现自动的负载均衡,且这种平衡状态不会随着系统规模的变动而被打破。再者,本文提出的针对高维音频特征数据的K-means+聚类算法,不仅有着良好的扩容比和收敛速度,其聚类结果在一定程度上还能反映不同集群的音频特征在语义上的差异,从而为基于内容的音频查询提供索引支持。第三,本文提出的两步匹配策略,除了能够满足音频查询中唯一命中的常用需求,还能帮助找到和查询片段风格类似或不同版本的音频数据,且基于内容的音频查询在查全率、查准率以及响应时间上均有较好的表现。从实验结果来看,结合这些工作的成果实现的海量音频数据管理系统能够很好地完成音频的存储和查询工作。虽然音频特征提取是本系统其中一个不可或缺的环节,但由于这部分的研究属于音频处理领域,且缺乏对音频特征提取原理的认知并不影响系统对音频特征的处理和使用,因此这部分内容本文不会涉及太多。同时,本文主要关注的是基于内容的音频数据管理,因此在研究和实现的过程中并没有同时利用音频的元数据信息。这将是后续工作的一部分。
其他文献
<正>记者:请问如何理解传统乡贤文化的力量?张颐武:乡贤文化是中国农耕文化的产物,乡贤文化实际上属于士阶层文化在中国乡土的一种表现形式。传统中国社会中,士阶层是社会的
<正>2013年9月份,中国火锅连锁品牌"海底捞"雄心勃勃派出了进军美国市场的先头部队。开在美国的第一家门店位于南加州,公司对此寄予厚望,期待庞大的美籍华人群体能让海底捞实
期刊
语用学和修辞学是两门独立的语言学分支学科,它们之间既有联系又有区别。语用学和修辞学在学科性质与追求的效果上是相同的,但是不同的历史起源,定义,研究性质和研究范式使得
"媒介审判"是指新闻媒介违反司法程序,超越职权对案件做出判断,是一种违法的和无效的裁判。新闻媒介的影响力将会使这种裁判在社会上产生巨大的影响,影响到公众的正确认知和
随着我国经济的发展,使得劳动力的流动性不断增强,导致了许多子女并不在老年人身边,城市中空巢老人数量大大增加,使我国传统的家庭养老模式很难提供到位的养老照顾和服务。而
<正> 目前的伸缩臂轮式起重机的伸缩机构以采用液压油缸传动为主,臂架为管式或箱形结构,故起重臂自重大,造价高。为了克服这种缺点,美国格罗夫制造公司的TM 2500型汽车起重机
本文主要从同音联想,相似联想,接近联想和分类联想等记忆法具体阐述运用联想记忆法来提高学生的学习兴趣,进而有效地解决学生在词汇学习方面"记不住"的难题。
<正>出版社:新世界出版社出版年:2014 11页数:276定价:35 8元装帧:平装lSBN:978751 0450495《三联生活周刊》资深主笔袁越(土摩托)七年走访全球转基因种植大国,通过征询全球
人为造成的温室气体排放引起全球气候的变化,已成为全球尤其是中国关注的热点。建筑作为高能耗行业,为环境问题带来了巨大挑战。建筑的物化阶段以其碳排放时间较为集中、碳排
<正>文章基于协同治理理论视角,提出发展珠海实体经济、完善交通发展规划、发展城市公共交通、推进湾区政府合作、塑造多元治理格局等优化珠海市政府交通基础设施建设的具体