基于MFCC和运动强度聚类初始化的多说话人识别

来源 :计算机应用研究 | 被引量 : 17次 | 上传用户:fc18597048
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对常用基于音频特征的多说话人聚类初始化方法精度不高这一问题,提出了一种基于视频信号的新方法。该方法通过运用每一时间帧视频信号的运动强度特征对聚类初始化阶段的初始话者类进行选择,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,在整个会议集上该方法相比其他方法有了很大改善,较之线性初始化系统的错误识别率平均降低了19.436%,较之改进的线性初始化系统的错误识别率平均降低了16.618%。
其他文献
为了解决证据理论中冲突证据合成问题,提出了一种局部冲突部分分配策略。该策略假设证据具有一致可信度,设定一个阈值,将大于该阈值的局部冲突按比例分配给产生该冲突的焦元,并用标准合成规则对证据进行融合,使合成的结果更加可靠。仿真结果表明该策略能有效解决冲突证据合成问题。
提出了一个基于内容及相似搜索的对等音乐文件共享系统。该系统建立在结构化的应用层覆盖网络之上,保证了系统的可扩展性和避免了网络消息的洪泛;利用了集合对等点来完成音乐文件的元数据的注册和搜索;把音乐文件的属性名—属性值对(attribute-value pairs,AV-Pairs)通过MFD(music file description)来表示,使系统既可以支持精确的检索,也可以完成复杂的语义相似性
针对移动Ad hoc网络传统重传机制存在的局限性,提出了一种新的重传控制算法(EX-TCGM),利用传输路径上的邻居节点传输丢失的数据包,使得路由上的任何节点都能够重传;并从理论上对该算法的有效性进行了分析。通过仿真,与按需距离矢量路由协议(AODV)、机会路由协议(ExOR)和基于分组移动的传输控制方法(TCGM)进行了性能对比和分析,EX-TCGM相对原协议在端到端平均时延和吞吐量上有所提高,
针对如何将IPv4环境下的包标记技术应用于IPv6的问题,结合已有的算法思想提出一种改进的算法,该算法采取固定概率将路由信息标记到扩展首部hop-by-hop,隧道模式下节点标记数据包时增加一个复制操作,扩大标记算法的适用范围;利用ESP的加密算法有选择地对标记消息进行加密。实验结果表明,新方案的兼容性和安全性得到了极大的提高。
为了确定医学图像的最佳灰度直方图熵,提出了一种基于改进演化算法的快速分割方法,能够自适应调整交叉和变异概率,既保证了种群的多样性,又克服了传统演化算法局部最优、收敛过快的缺点。搜索到的最佳阈值不仅比传统演化算法稳定性好,还有效地缩短了搜索时间,快速地实现了医学图像分割,而且分割后的图像可读性强。实验结果表明,该方法速度快、分割效果好。
在基于边缘的活动轮廓模型中,边缘停止函数的选择将直接影响模型的分割效果。传统的边缘停止函数仅仅是基于梯度模型建立的一个单调递减的正函数,基于这种边缘停止函数的活动轮廓模型存在两个缺点:一是对噪声比较敏感;二是对灰度不均图像分割不准确。为此,提出一个自适应变化边缘停止函数。实验表明,使用该边缘停止函数构造的边缘活动轮廓模型能够较好地克服上述不足。
由于退化图像的点扩散函数难以准确确定,提出一种基于Fourier正交基函数的前向神经网络图像复原模型,该模型以一组Fourier正交基为隐层神经元的激励函数,根据误差传递算法进行权值修正,达到收敛目标。给出Fourier神经网络及其相应的衍生算法的图像恢复实现步骤。实验表明,该方法能较好地实现图像的复原。
针对传统IP时间隐蔽信道传输速率低,在广域网中缺少一种稳定的时间同步机制,难以实现收发双方间可靠、稳定传输隐蔽信息的问题,提出了一种可靠网络隐蔽信道的模型。这种信道利用在固定时间窗口内发送的IP数据包数量作为载体传输隐蔽信息。通过引入一种新的信息编码机制,显著提高了网络隐蔽信道的传输带宽。进一步提出了一种比特块定界方法,解决了传统IP时间隐蔽信道的时间同步问题。实验结果表明,提出的可靠网络隐蔽信道
针对大规模地形动态漫游提出实现流程和算法框架,基于分层分块地形LOD组织存储策略完成数据预处理,绘制阶段提出视点相关的地形调度和简化算法,利用多线程处理机制进行地形块裁剪和内外存数据交换,借助GPU硬件实现场景加速绘制算法,并提出分块地形和纹理数据的无缝拼接策略。真实数据实验的算法比较和性能测试结果表明,该方法具有支持数据量大,绘制效率高、实用性强等特点。
传统的访问控制方式已不能满足多域环境下的资源共享和跨域访问的安全需求,建立安全互操作模型是进行安全互操作的有效途径。针对现有域间安全互操作模型未考虑用户平台的问题,提出了一种基于可信等级的域间安全互操作(TLRBAC)模型。该模型引入了用户可信等级、平台可信等级和域可信等级,制定了域间安全互操作方法。分析表明该模型既保证了用户的可信接入,又能有效地控制因平台环境而引起的安全风险问题。