感知哈希及其在语音检索与认证中的应用

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:jjx2777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“互联网+”时代的到来,网络通信飞速发展,人们可以直接通过语音与计算机或各种移动终端设备之间进行交流,完成各种语音指令,给人们带来方便的同时也导致语音的存储量“爆炸式”增长。云计算的诞生,为大规模信息存储提供了转机。但云存储平台并不是可信任的第三方,如何保证云端数据的安全性以及如何提高云端大规模语音数据处理的效率成为亟需解决的问题。针对上述问题,本文研究了适用于语音的感知哈希算法,并将其应用于大规模语音检索与认证应用中,主要研究工作如下:(1)设计了一种基于共振峰频率和时域能量差的感知哈希方案,该方案利用共振峰能够表征说话人音色特征这一特性,提取语音段的共振峰频率作为特征参数构造语音的粗糙感知哈希序列。利用时域短时能量差具有较强的鲁棒性以及计算复杂度相对较低的特点,将时域能量差作为语音段的细节特征,量化为语音的细节感知哈希序列,将粗糙感知哈希序列和细节感知哈希序列按分帧的顺序结合起来,作为最终的感知哈希序列。仿真实验结果表明,本文算法具有很强的感知鲁棒性,良好的区分性和摘要性,并且该算法的设计过程是从实际应用角度出发,将该感知哈希方案应用于大规模语音检索时能有效提升检索效率。(2)实现了基于感知哈希的语音检索与认证应用。感知哈希算法特征选取和量化方法多种多样,但在各种应用中的匹配过程通常都是逐一匹配感知哈希序列的比特位,选取相关性最高的记为匹配结果,这种方法增加了许多不必要的计算量。本文从大数据的应用背景出发,提出分级匹配思想,可明显提升计算效率,为该感知哈希方案应用于云端大规模语音检索提供了新思路。本文设计的语音检索方案,匹配过程首先对语音的粗略特征进行匹配,筛选出与目标语音具有相似音色的语音片段,然后对筛选出的具有相似音色的语音匹配其细节特征,最终获得精确匹配结果。应用于云端海量语音信号处理时可以省去匹配细节感知哈希序列的计算量,提高匹配效率。同时考虑到数据传输过程的安全性,对检索结果进一步认证,认证通过才返回给用户。实验结果表明,该检索方案可获得较高查全率和查准率,同时检索效率明显提高。
其他文献
在高速列车状态识别中,由于产生故障的原因具有复杂性和多样性,单一种类的特征往往不能全面表征列车运行状态,易造成错误判决。因此,常在状态识别时提取数据的多种类型的特征
工业上,对筒状体壁厚的测试目前仍然以手工机械接触式测量方法为主,但是该方法一方面对被测物体表面有不同程度的损伤;另一方面,对一些密闭体及不规则结构体的壁厚测量无能为力。本文提出了基于超声的高精度测厚技术及系统设计方法。在分析超声波基础理论、小波去噪方法及功率谱估计方法的基础上,针对筒状体的壁厚测量问题,设计了一种由超声波探伤仪、机电控制系统、数据采集系统和数据处理单元构成的高精度实时超声测厚系统。
本文针对膛内压力测试装置在当今测试中作遇到的问题。为解决大、中、小口径膛压测试的需求,综合分析了国内外膛内压力测试装置的发展,在本实验室现有的放入式电子测压器的基
随着通信技术的高速发展,通信环境的日益复杂,各调制信号之间的混叠现象也越来越频繁了。因此,混合信号识别作为干扰抑制技术和混合信号分离技术的前置工作无论在军用还是民
合成孔径雷达(SAR)是一种置于运动平台(如飞机和卫星等)的成像雷达,具有全天时、全天候、远距离成像的特点,因此可以大大提高雷达的信息获取能力,近年来在军事和民用方面都得
无线传感器网络作为一种全新的信息获取与处理技术,能够广泛应用在国防军事、环境监测、空间探索及物品跟踪等许多领域。无线传感器自身的特点及工作环境决定了节点的能量是
WiFi网络由于具有低成本、高速率、可移动性、易安装、易维护等方面的优势,使其得到了广泛应用,成为人们接入移动互联网的主要方式。因此,WiFi网络的覆盖范围不断扩大,用户数
随着计算机网络技术的发展和广泛应用,信息的获取和处理越来越便捷,信息的共享程度越来越高,在极大推动社会进步的同时,也为不法分子非法使用资源提供了可乘之机,信息系统安
在光学显微镜成像的时间序列细胞图像的多细胞追踪系统中,对于活跃细胞的准确预测、追踪是一个尚未解决的难题。尽管活跃细胞在神经干细胞的追踪中所占比例不大,但是它的作用