【摘 要】
:
随着深度学习的快速发展,文本识别技术逐渐应用到医疗领域。本文旨在研究中文病历文本图像的识别方法,针对以卷积神经网络为基础的识别算法对中文病历文本识别精度不高的问题,提出了一种基于残差的多尺度特征提取网络,并在此基础上结合了不同尺度的自注意力机制,相比基于卷积神经网络的识别方法,本文提出的方法具有更好的特征提取和分类能力,提高了对中文病历文本图像识别率。中文字符拥有比其他常见字符更复杂的结构,实际的
论文部分内容阅读
随着深度学习的快速发展,文本识别技术逐渐应用到医疗领域。本文旨在研究中文病历文本图像的识别方法,针对以卷积神经网络为基础的识别算法对中文病历文本识别精度不高的问题,提出了一种基于残差的多尺度特征提取网络,并在此基础上结合了不同尺度的自注意力机制,相比基于卷积神经网络的识别方法,本文提出的方法具有更好的特征提取和分类能力,提高了对中文病历文本图像识别率。中文字符拥有比其他常见字符更复杂的结构,实际的中文病历文本图像中的中文字符纵向结构复杂度与横向结构复杂度相当,且单个中文字符的高度一般是大于宽度的,根据中文字符的这些特性,本文主要做了如下工作:1.设计了一个基于CRNN的识别模型V-CRNN。该模型提高了特征图的纵向特征信息维度,保留中文字符的纵向细粒度特征。提高了纵向特征信息维度后,即使降低特征图通道数,模型相比CRNN依然取得了更高的识别率,对存在上下结构缺失的字符有更好的鲁棒性。2.设计了一个基于残差多尺度识别模型Ms Net。其利用了残差网络的特性,拥有更深的网络结构,合并了不同的尺度特征信息并为每一个尺度的特征图保留更多的纵向特征信息,提高了网络的特征提取能力。实验证明,该特征提取网络能有效的提高对中文病历文本的识别率。3.为了进一步强化网络的纵向特征提取能力,本文设计了一种二维的循环神经网络模型V-Ms Net,利用纵向的双向长短时记忆网络在浅层网络中捕获图像的纵向依赖。实验表明,纵向的Bidirection-LSTM对中文字符的识别率提升是有效的。4.结合本文提出的特征提取网络,设计了一种多尺度的自注意力识别模型S-Ms Net。该模型在不同尺度特征图上计算各个位置的相关性,能捕获更多的横向和纵向依赖信息。实验证明,相比基于残差的多尺度特征提取网络Ms Net,引入了多尺度的自注意机制后的识别模型S-Ms Net对中文病历文本图像的特征提取能力进一步加强,拥有更好的识别性能。
其他文献
目的:观察清热解毒中药洗剂治疗Ⅱ度烧伤创面前后,创面的边缘炎症反应积分、创面细菌培养结果、疼痛评分、愈合率、愈合时间、临床疗效及安全性,为临床中医治疗Ⅱ度烧伤创面提供有效的治疗方法。方法:将符合入选标准的40例烧伤患者按照随机对照原则划分为两组:中药治疗组和碘伏对照组,每组20例。两组均给予补液抗感染、营养支持等基础治疗,对照组局部外用碘伏冲洗,治疗组局部外用清热解毒中药冲洗,观察两组治疗前和治疗
伴随着改革开放的伟大进程,现代博物馆已然成为一个国家、一个城市重要的文化教育机构,同时也是公众游览休憩的重要场所。科普场馆肩负着向公众传播科普教育的使命,同时又作为地区或城市重要的旅游景点,始终吸引着大批来自四面八方的游客纷至沓来。伴随着场馆服务类型的不断延伸发展、公共服务能级不断提升,场馆自身除了需要不断经受大客流考验,重视观众人身公共安全管理以外,科普场馆公共服务质量的管理也是尤为重要的。本文
2019年底至2020年初突如其来的新型冠状病毒肺炎疫情给我国经济发展带来了巨大冲击,企业停工停产,学校停学,给人们的工作、学习和生活都带来了极大的不便。随之而来的是,用人单位需求的急剧下降、高校应届毕业生就业压力的增大。本研究为质性研究,采用目的性抽样的方法选取了来自5个城市12所高校的17名社会工作专业硕士应届毕业生为研究对象,旨在探究其在新冠肺炎疫情下的求职体验。本研究借用马克思·范梅南对于
高等植株进行光合作用的主要细胞器为叶绿体,叶绿体的组成部分包括外被(chloroplast envelope)、基质(stroma)和类囊体(thylakoid),基质是光合作用过程中暗反应发生的场所,类囊体则
本文以H村宅基地改革试点政策为研究对象,首先对宅基地改革和政策评价的概念进行阐述。在研究S-CAD政策评估与分析方法的理论及应用的基础上,构建基于S-CAD方法的宅基地改革政策评价框架。以H村的宅地基改革试点政策为案例对象,通过分析总结相关政策文本及改革实施推动方案,在对H村宅基地改革政策的价值前提、目标、手段和结果要素进行识别的基础上,对要素间的一致性、充要性和依赖性进行评价。通过各项分析结果,
随航空航天、5G、虚拟现实、人工智能、柔性可穿戴、新能源等技术飞速发展,对热管理材料的需求越来越多样化。对于新一代高功率、高度集成、体积更小的电子产品需要解决电子
当前,由于消耗传统化石材料而导致的日益加剧的能源危机和环境污染问题已经阻碍了人类社会的可持续发展。因此,寻找可再生替代能源已成为一个关键问题。由于高能量密度和无碳
量子纠缠是量子信息的物理资源,它在量子通信,量子隐形传态,以及量子计算的各种任务中起到了重要的作用.正是因为这样,人们越来越关注量子纠缠的各种性质.近年来,非惯性系下
大气压介质阻挡放电(DBD)作为能够产生均匀、稳定低温等离子体的重要手段,因近些年在材料加工、薄膜沉积、表面改性等方面具有应用潜力备受关注。本质上,DBD是复杂的放电系统
流动儿童的生活环境和家庭教育具有一定的特殊性,“流动的经历”可能使其更容易出现学习适应不良、学习兴趣减退和学习偏差行为增加等状况。其中,学业拖延则是一个较为普遍的学业偏差行为,是一种消极的心理倾向和回避性行为反应。小学阶段是儿童的生理、心理成长发育关键期,对这个阶段的流动儿童来说,学业拖延对其学业成就、学业效能感、日后的生活态度与行为习惯、亲子关系等方面都存在消极影响。如果不加以干预,它对当下和未