论文部分内容阅读
自闭症谱系障碍(Autism spectrum disorder,ASD)是一种发病于儿童早期的广泛性神经发育障碍,其特征为社交障碍、语言和非语言交流障碍、兴趣狭隘、重复和刻板行为。因其生活难以自理、社会适应不良,无有效药物治愈并极易发展为终身残障,只能依靠长期教育干预训练辅助矫治,给家庭和社会带来巨大的经济及精神负担。目前,自闭症的病因尚不清楚,在医学领域也没有可以治愈的特效药。临床对照研究表明,早期发现和及时干预可以显著改善预后,能够很大程度上改善自闭症儿童的语言能力、认知能力以及行为习惯。因此,自闭症的早期识别工作意义重大,越来越多的研究人员开始探索自闭症早期识别方法。婴幼儿的社会交往能力、游戏技能、语言和认知能力在早期自闭症识别中具有良好的区分度,在此基础上,结合婴幼儿在不同年龄段的生长发育规律以及专科医生的临床诊断标准,研究者们开发出了多种自闭症早期识别工具,这些工具大多通过标准问卷由家长或其他看护人员完成,搜集儿童的日常行为习惯和认知能力,或通过人工观察,由专家在严格控制的临床环境下使用。但这些工具在应用过程中存在一些问题,主要体现在以下几方面:(1)儿童评估过程需要专业的评估人员参与,而有经验的评估人员相对匮乏;(2)评估过程耗时费力、效率低下;(3)评估过程容易受各种主客观因素影响,评估结果的客观性有待提升。随着移动互联网、智能传感器、云计算等信息技术的发展,人工智能技术越来越多地应用于医学和教育领域。目前,自闭症的诊断和治疗领域每天都产生大量的数据,基础数据的积累量已达到一定规模,海量的历史数据可成为自闭症识别的判断依据,人工智能技术有望提供一种精准、快速、智能化的自闭症识别方法。另外,大量研究表明自闭症儿童存在共情能力缺陷,共情条件下的多模态数据能够提供更多的自闭症儿童特征性信息,有利于提升自闭症儿童的识别精度。因此,本文研究了共情条件下融合多模态数据的自闭症儿童识别方法,该研究主要探索以下问题:(1)自闭症儿童的共情能力缺陷主要存在于共情过程中的哪一个阶段?哪些数据可以有效表征这些缺陷?(2)如何通过人工智能技术提取各种数据的有效特征,探索各模态数据之间是否存在有利于提升识别精度的互补性信息?(3)针对多模态的多源异步数据,如何充分利用数据之间的互补性信息进行数据融合,提升自闭症儿童的识别精度?本研究从问题出发——自闭症儿童存在共情能力缺陷,通过共情能力缺陷在生理数据、行为数据和认知数据方面的量化研究,进而提出假设——自闭症儿童共情条件下的行为数据、认知数据可以用于自闭症早期识别,然后应用假设——提出基于单模态数据(行为数据或认知数据)的自闭症儿童早期识别方法,并提出融合多模态数据的自闭症儿童识别方法,最后验证假设——将本文提出的智能化自闭症识别方法与传统方法识别结果进行一致性检验。具体的研究内容包括:(1)共情条件下自闭症儿童生理、行为、认知数据特异性研究;(2)基于单模态数据的自闭症儿童识别方法;(3)基于多源异步多模态数据的自闭症儿童识别方法;(4)智能化的自闭症识别方法与传统方法识别结果的一致性检验。本文的主要贡献如下:(1)本文研究和分析了共情条件下自闭症儿童和典型发展儿童的生理数据、行为数据和认知数据,发现自闭症儿童的共情能力缺陷主要体现在较差的认知共情能力和较差的面部表情模仿能力;自闭症儿童的共情过程存在正常的自下而上的情绪分享过程和异常的自上而下的认知调节过程。因此,我们提出共情条件下的行为数据、认知数据可应用于自闭症儿童早期识别。(2)本文将儿童眼动数据、面部表情数据、认知数据分别应用于自闭症的早期识别,并探索每种数据对自闭症儿童和典型发展儿童的识别能力,发现眼动数据、面部表情数据以及认知数据都是识别自闭症儿童的有效指标,这些数据之间存在互补性信息,融合这些互补性信息有利于提升识别精度。(3)本文提出基于互信息的加权随机森林算法对儿童数据进行分类,使用互信息评估每棵决策树的分类能力,为每棵决策树分配预测权重,根据每棵决策树预测权重进行加权投票,有效提高了随机森林的预测精度,有利于提升自闭症儿童的识别精度。(4)本文提出基于多源异步多模态数据的自闭症儿童识别方法,将多模态数据进行混合融合,混合融合过程分为两个层次:第一层对具有时间同步性的不同源数据进行特征融合,融合得到行为特征向量和认知特征向量,分别使用行为特征向量和认知特征向量进行决策;第二层对行为数据和认知数据各自的识别结果赋予决策融合权重,然后进行决策融合。混合融合方法既充分利用了不同数据之间的互补性信息,又保证了数据决策的灵活性和客观性。