帕金森病语音障碍深度学习的解码研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:zhanghongyingyxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用语音障碍进行帕金森病检测是目前帕金森病早期诊断的研究热点之一。近年来基于深度学习的语音障碍检测发展迅速,且检测正确率高。由于深度学习固有的特点,使得通过深度学习网络自动学习的语音特征在医学上可解释性较差。针对这一问题该文提出研究帕金森病语音传统特征梅尔频率倒谱系数和语音深度学习特征间的关系。主要使用偏最小二乘法、多任务Lasso(Least absolute shrinkage and selection operator)和多任务弹性网三种方法展开一系列讨论。首先,该文通过卷积神经网络对语音数据集进行分类,得到预训练模型。利用预训练模型提取语音的深度学习特征,同时提取语音的梅尔频率倒谱系数,进而对以上两种特征进行相关性分析,论证该文提出方法的可行性。构造了一种从语音梅尔频率倒谱系数解码语音深度学习特征的解码框架。其次,利用偏最小二乘法对语音数据训练集的两个特征集进行多元映射,并通过对比实验确定偏最小二乘法的成分个数。利用训练集得到的偏最小二乘法模型对测试集语音的梅尔频率倒谱系数进行解码,进一步的对语音的深度学习解码特征进行质量检验,并对偏最小二乘法模型进行分析。再次,利用多任务Lasso实现对语音数据训练集的两个特征集间的多元映射,通过对比实验实现对多任务Lasso模型参数的优化。利用优化后多任务Lasso模型实现对测试集语音梅尔频率倒谱系数的解码,对语音的深度学习解码特征进行质量检验,并对分多任务Lasso模型进行分析。最后,利用多任务弹性网实现对语音数据训练集的两个特征集多元映射,通过多组对比实验完成对多任务弹性网模型参数的优化。利用优化后多任务弹性网模型实现对测试集语音梅尔频率倒谱系数的解码,对语音的深度学习特征进行质量检验,并对多任务弹性网模型进行。同时对比分析该文所提出的三种多元映射方法在对语音梅尔频率倒谱系数进行解码的过程中的表现。
其他文献
异常检测已经被广泛应用于网络安全、模式识别、数据挖掘等应用领域。异常检测旨在发现正常模式中的异常模式。无监督异常检测方法通过对样本的概率分布估计来发现异常数据,
网络的飞速发展以及移动设备的普及推动了基于位置的社交网络(Location Based Social Network,LBSN)平台的使用,为个性化的兴趣点(Point-of-Interest,POI)推荐系统带来了巨大
芒果目标产量预测对于了解芒果产量变化趋势、规划发展芒果生产,加强气候灾害的防御和治理能力,推进农业信息化有着重要意义。影响芒果产量的相关气象要素繁多,它们与产量之
随着空间数据和数据库的迅速发展和广泛应用,空间数据挖掘越来越重要。在地理空间中,经常位于一起的空间特征子集称为空间(正)co-location模式。虽然全连接、部分连接以及无
电容层析是过程层析技术中被广泛应用于两相流和多相流的一种检测技术,由于其具有结构简单、无辐射和低成本的特点,目前在石油和天然气运输方面工业前景广阔,研究其发展具有
阿尔茨海默病(Alzheimer’s disease,AD)是老年期认知障碍疾病中最常见的类型,该病常起病隐匿,随着病情进展会对老年人的身体健康产生严重危害,如何通过有效的方式对AD患者进
酸性磷酸酶(ACP)是一种广泛存在于生命体内的水解酶,参与多种生理过程。作为前列腺癌等疾病的血清标志物,ACP活性监测对相关疾病的早期诊断具有重要的临床意义。现有的众多ACP
模型驱动的软件开发方式(Model-Driven Development,MDD)目前被广泛应用于面向服务架构的信息系统中,而模型转换作为MDD中的重要环节和核心技术,它的正确性直接影响了基于MDD
统计数据显示:约四分之三的游客在出游前都会去登录主流旅游网站查看用户评论(评分),以确定更好的旅游目的地,同时制定出游路线。旅游景点推荐的研究已取得一定进展,但仍存在数据稀疏、未考虑用户隐性偏好、未深入挖掘景点图像的潜在语义等问题。提出采用分层抽样统计模型获取用户偏好,改进贝叶斯个性化排序(Bayesian Personalized Ranking,简称BPR)及视觉贝叶斯个性化排序(Visual
在超大规模集成电路(Very Large Scale Integration,以下简称VLSI)物理设计中,布局问题将模块放置在一个给定的区域内,在满足模块间不互相重叠的基础上,优化一些相关指标(如