论文部分内容阅读
头相关传输函数(Head-related Transfer Function,HRTF)是双耳三维音频的主要技术之一,利用特定空间位置的HRTF与音频信号进行卷积即可生成对应空间位置的三维音。HRTF随着空间位置的变化而变化,当前HRTF大多通过测量方式获得离散值。测量得到的HRTF由于测量设备、时间成本等原因,其测量位置在空间中的分布是相对稀疏的,在实际应用中,无法满足三维音对HRTF空间分布的需求。从空间分布相对稀疏的HRTF数据库中插值得到空间分布相对密集且准确的HRTF数据集是解决上述问题的有力途径。为此本文开展了HRTF插值的相关研究,主要工作如下:已知的头相关脉冲响应(Head-related Impulse Response,HRIR)插值方法中,基于空间位置关系获得权重信息来计算HRIR时延往往难以表达空间方位与HRIR时延间的非线性关系;基于相关性对齐的HRIR插值方法并不能保证HRIR时延的完全对齐,从而导致HRIR插值准确度下降。针对此问题,本文提出了利用径向基神经网络(Radial Basis Function Neural Network,RBF神经网络)的非线性拟合能力,设计HRIR时延预测模型,建立空间方位与HRIR时延的映射关系。并在此基础上提出了基于径向基神经网络的HRIR插值算法,较传统的基于空间四面体的HRIR插值方法,该方法插值所得HRIR的平均信号失真比(Signalto-Deviation ratio,SDR)提升5dB。传统的基于权重的线性组合的插值方法在各频率点上的权重是固定不变的,而通过对不同空间方位的HRTF数据分析及相关性分析发现,各频率点上的HRTF值在空间中的变化是不一致的,由此导致HRTF插值误差。针对此问题,本文提出了基于频谱成分相关性分析的HRTF插值模型。利用待插值方位紧邻方位的已知HRTF间的频谱成分相关性对待插值HRTF的频谱特征进行估算,从而实现更精确的HRTF插值效果。对比传统的线性插值方法,该方法插值所得HRTF的平均SDR提升1.8dB。客观实验结果表明,相比较于传统的基于空间位置权重的方法,利用径向基神经网络能够有效预测不同空间方位的HRIR时延信息;相比较于传统的基于权重的线性组合的插值方法,利用频谱成分相关性分析能够有效提升HRTF的插值准确性。