基于深度学习的儿童抽动症动作检测与识别研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:pluto_jelly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抽动症(Tourette Syndrome,TS)是一种以重复、刻板、无意识、无目的的运动性或声音性的抽搐动作为典型特征的,多发于儿童的慢性神经系统疾病,易产生抑郁、焦虑、睡眠问题等多种并发症,对患者的正常生活、社会交往产生严重影响。临床抽动症的诊断需要经过包括病史收集、临床检查与评估、实验与辅助检查等复杂过程,抽搐程度评估则需要医生对患者进行长时间的访谈,根据量表对动作行为进行评分。诊断与评估过程消耗大量时间且需要医生与患者之间的高度配合,同时存在患者主动隐藏抽搐的可能,不利于诊断与评估。针对上述抽动症辅助诊断和严重程度评估中的困难和挑战,本论文探讨了深度学习在抽动症辅助诊断中的可行性,使用机器视觉对抽搐动作进行检测与识别。本论文以浙江大学医学院附属第二医院儿科的72例抽动症患者的正面监控视频为基础,对抽搐动作检测与抽搐动作识别进行深度学习研究,构建了基于多示例学习(Multiple Instance Learning,MIL)的残差网络(ResidualNetwork,Resnet)模型对抽搐动作进行检测,并构建基于三维卷积神经网络(Three-Dimensional Convolutional Network,3D-CNN)的动作分类模型对抽动症患者的各类抽搐动作进行识别。研究结果表明,本论文构建的基于多示例学习的残差网络模型在异常检测中达到了 95.48%的准确率,在新的患者数据中进行测试也能够达到77.03%的准确率与83.81%的召回率,同时,基于3D-CNN模型的抽搐动作分类准确率达到了84.78%。本论文的研究成果证明了深度学习在抽搐动作检测与识别中的可行性,能够在仅使用录像设备的情况下完成动作检测与识别,有效地帮助医生进行大规模的视频异常动作标注,同时为抽动症辅助诊断与严重程度评估提供一定参考。
其他文献
信息时代人们对信息获取的需求日益增加,尤其从图像中获取有用信息的需求在各个邻域都变得非常重要。图像中目标的边缘信息获取是图像信息获取的重要研究方向之一,也是图像分析的基础。本文围绕灰度图像中目标的边缘检测展开了研究,对已有的边缘检测算法进行了改进,主要工作如下:一、提出了改进的多方向结构元素边缘检测算法。在介绍形态学边缘检测算子的基础上,分析了多方向结构元素对边缘检测结果的影响,对传统的多方向结构
随着智能终端设备的普及,消费者倾向于通过网上购买商品,这催生了电子商务的繁荣。由于电子商务虚拟环境普遍存在着信息不对称性,消费者无法准确获得商品质量信息,因此更多地借助历史评论衡量商品的好坏。然而,有些不法商家抓住机制的漏洞,雇佣网络水军撰写不实的言论以提高自身声誉,吸引消费者购买。评论大数据的产生使得人们很难用肉眼辨别出哪些是虚假评论。传统的虚假评论检测模型取得了一定的研究成果。但是,由于这些模
随着移动互联网的飞速发展,基于位置数据的应用层出不穷,为人们的生活带来极大方便的同时也使得用户的隐私受到巨大的威胁。位置隐私泄露场景以及保护方法是研究的重点,已有的研究仅从位置、轨迹的角度考虑隐私泄露场景,但是位置数据的位置特征也能够暴露用户的隐私信息。针对位置特征会暴露用户隐私的问题,提出基于特征安全的位置隐私保护模型。模型将位置特征划分为发布特征和扰动特征,定义特征相似社区和特征?-多样性,根
种群模型在数学生态学领域是众多学者研究的对象,人们将自然生态中的问题抽象成数学模型,进而解释说明生态系统中的现象.随着种群生态学的发展,我们所研究的模型也更加具有实际意义,其中一类重要的研究方向是对时滞种群模型的研究.时滞是自然生态中一种常见的现象,例如在捕食模型里我们往往假定幼年种群不具备捕食能力,从幼年期到成熟期有一个生长期,这就是一种时滞现象.因此,本文研究的第一类问题就是在已有的互惠模型基
随着信息技术的发展,智能制造成为制造业的必然发展趋势。在汽车制造领域,为满足多样化的市场需求,多品种、小批量的柔性生产方式被广泛使用。在涂装车间内,漆后车身有较大概
随机微分方程的理论被广泛应用于金融、系统科学、工程科学等领域.例如:在金融领域可用于解决期权定价问题,在生物领域可用于揭示疾病的发生规律,在物理领域,可用于研究布朗粒子的逃逸与跃迁问题等.由于现实中动力系统的发展变化除了受随机因素的影响,不仅与当前的状态和过去的状态有关,还与过去状态的变化率有关,同时系统内外部变化亦导致系统在有限状态间转换,而Markov调制的中立型随机延迟微分方程模型能很好地描
连词“无论”是无条件复句的重要标志。本文重点考察“无论”在单句、复句中的使用情况,并对与“无论”高频搭配的副词“都”组成的“无论……都……”进行句法、语义层面的
逻辑回归是多标签分类以及排名任务中最常用的损失形式,但逻辑回归下的Sigmoid交叉熵损失函数受类别不平衡的影响极其严重。这种不平衡主要来自两方面,一是单个类别正例样本与负例样本比例的不均衡,二是各个类别之间样本数量上的巨大差别。这篇文章首先指出了这两种不平衡能通过对分类器输入随机生成的噪声样本来量化,即使噪声样本不能提供任何有助于分类的信息,分类器对噪声样本给出的预测值在各个类之间仍然有显著且稳
图像融合是将两个或者两个以上的传感器在同一时间或不同时间获取的关于某个具体场景的图像或者图像序列信息加以综合,以生成一个新的有关此场景解释的信息处理过程,而这个解释是从单一传感器获取的信息中无法得到的[1]。近些年来,国内外研究者在图像融合领域取得了丰硕的研究成果,本文将着重介绍在平移不变剪切波变换(Shift-Invariant Shearlet Transfom,SIST)下的图像融合方法。与
随着我国对野生动物保护力度的加强,对偷猎、贩卖、走私野生动物等违法犯罪行为的打击力度也逐渐加强,因此涉案野生动物及其制品的物证鉴定对惩治犯罪至关重要。目前,涉及偶蹄目动物的犯罪案件频发,而现主要的鉴定手段为宏观形态鉴定和DNA鉴定,有关毛微观形态学鉴定的研究较少,且主要以背毛研究为主。本文以水鹿(Cervus unicolor)、鼷鹿(Tragulus javanicus)、赤麂(Muntiacu