基于深度学习的化验单内容提取技术研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:guobin_tj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能的发展给医疗行业注入了强大的活力,依托人工智能技术的医学辅助诊断系统,可以有效地解决“患多医少”的压力,同时也能减少医学中的误诊现象,减少医患纠纷的发生。将化验单图像内容准确转换成结构化数据是医学辅助诊断系统安全可靠运行的保证,此外患者手上的纸质化验单图像数据也是医疗大数据的重要来源,中文化验单包含了中英文、符号和数字等混排形式的字符,且目前尚缺乏相关的公开数据集,如何将化验单内容准确自动转换成结构化计算机可直接使用的数据,化验单图像内容识别技术尤为重要。本文依托计算机图像处理技术,对化验单内容识别技术相关算法进行了研究分析,设计了一套化验单内容提取系统。主要工作概括如下:首先,对化验单图像预处理算法进行分析研究,针对如何有效地从复杂背景下正确提取化验单图像区域,提出了使用融合算子对化验单图像进行边缘检测。相较于使用单一算子,该方法使得在背景复杂情况下,依然能很好地提取到化验单图像的边缘信息;研究了不同的化验单图像二值化算法,提出采用二维的大津算法对化验单图像进行二值化。该方法很好地解决了化验单图像在二值化过程中出现文字断裂和大量墨块问题。其次,深入研究了基于深度学习的化验单图像文本检测算法,提出了基于深度学习的多特征融合文本检测算法,该方法将VGG、Inception、Resnet特征提取网络融合到原始EAST算法中,能有效地解决以投影法为代表的传统检测算法得到的文本框不准确以及当前深度学习方法出现对文本框特别是长文本框出现漏检严重的现象。此外,对基于单字识别方式的化验单文本识别算法进行分析研究,并基于Tesseract-OCR单字识别模型,提出了本文改进方法。该方法使用本文提出的文本检测算法,代替原模型中的文本区域检测模块,配合Tesseract-OCR模型的识别模组进行识别任务,识别准确率得到极大的提升,但依然受限于模型字符分割的效果,对形近字和左右结构字识别效果不佳。于是提出了改进的CRNN端到端序列识别模型,该方法在CRNN的基础上,使用ResNet101-IBN(b)网络进行特征提取,并采用特征重用技巧,在加深网络深度的同时提升了模型的性能,识别准确率得到进一步的提升。最后,基于PyQt平台,开发了一套中文化验单内容提取系统,经过调试验证,该系统能较好地完成识别任务,将化验单图像内容转换成结构化数据,满足使用要求。
其他文献
语音增强的目的是通过设计一种高效的信号处理算法,去除带噪语音中的各种干扰噪声,恢复出干净的增强语音,同时要保证增强语音有较高的恢复质量和可理解度。传统的语音增强算法在使用前需要对语音和噪声信号做出严格的假设,这限制了其在一些复杂的现实场景中的应用。近年来,无需任何假设、具有强数据建模能力的神经网络得到研究人员的广泛关注,成为本领域的主流算法。本文主要针对提高卷积神经网络全局建模水平和语音增强能力展
高速飞行列车是利用低真空环境和超音速外形减小空气阻力,通过磁悬浮减小摩擦阻力,实现超音速运行的运输系统。高速飞行列车的运行速度可以达到1,000~4,000km/h,具有高效、节能和环保等优点,有望成为未来的新型交通方式,近年来逐渐成为研究热点。由于高速飞行列车速度比已有轨道交通系统列车的速度高出许多,现有轨道交通系统的运行控制系统无法完全适用于高速飞行列车。因此,有必要针对高速飞行列车的特点,对
随着5G网络全球化部署进程不断提速,各行各业提出运行在用户设备(User Equipment,UE)上的计算密集型和时延敏感型的新型应用。虽然移动云计算(Mobile Cloud Computing,MCC)把高计算任务通过公用网络上传到集中式的云服务器上增强了UE的计算和降低UE的能耗,但是云服务器在空间上远离UE导致传输数据需要花费更高的时延。移动边缘计算(Mobile Edge Comput
近年来,随着深度学习在图像、自然语言等规则拓扑结构的数据上大放异彩,研究者们尝试将深层神经网络推广应用到3D点云数据,并开展了大量关于3D点云神经网络卷积算法的研究。但由于3D点云拓扑结构的不规则特性,特征池化算法,作为推动深度学习成功的一个重要部件,却较少人问津。特征池化算法在深度学习框架中,不仅起到提升计算效率的作用,同时能够提升模型的鲁棒性,是深度学习应用在3D点云数据上必不可少的一环。为此
直线电机驱动的多轴运动系统具有结构简单、加速度大、响应速度快、噪音低等特性,被广泛应用于机械制造的轮廓加工。然而,伺服滞后、各伺服轴之间动态特性不匹配、轴间耦合和外部扰动等因素会导致产品加工误差。如何提高多轴运动系统的轮廓跟踪精度一直是控制领域的研究热点。本文以双轴直线电机龙门系统为研究对象,围绕着如何提高运动系统各伺服轴间的协调性,处理不确定、外部扰动和执行器故障的影响等问题,展开了一系列研究。
由于我国高速铁路的不断发展,铁路系统正面临着更大客流,更多车次的严峻挑战。此外,旅客对于铁路出行的需求也不再仅仅是点到点的运送,旅客在旅途中的工作与娱乐需求也必须纳入考虑。这时,当前高速铁路系统所使用的基于第二代移动通信的GSM-R(Globle System for Mobile Communications-Railway)系统则逐渐显得力不从心,因此新一代高速铁路通信系统的研究势在必行。作为
随着人们生活水平的提高,车辆的普及程度越来越高,随之而来的交通事故也越发频繁。据统计,25%~30%的交通事故与驾驶员对道路的警觉程度直接相关,其中并线过程是交通事故的主要发生场合之一,而在非结构化道路,行人及其他非机动车车辆共享道路,驾驶的安全性完全依靠驾驶员的注意力集中度,因此而产生的交通事故也屡见不鲜,这些都给汽车行业的发展带来了巨大的挑战。为解决上述问题,且基于语义分割应有的特性,即具有多
随着互联网的发展,智能教育成为教育发展的迫切需求。学生知识追踪模型能够根据学生的历史学习记录获得习题表征和学生能力表征,追踪学生对知识的掌握情况。智能教育需要准确的学生知识追踪模型。目前,制约学生知识追踪模型效果的两个原因是:(1)习题表征不准确。以知识点为粒度的习题表征难以刻画习题的精确信息;以习题为粒度的表征,由于数据稀疏导致模型参数学习不准确;已有的综合知识点和习题的混合模型采用加性模型进行
深度学习在自然语言处理、图像识别领域的应用日益丰富。近年来,大量的研究涉及了医学影像的自动识别与辅助诊断。医学影像的识别成为了深度学习从计算机领域向医学领域延伸的热点和切入点。利用深度学习进行医疗影像的识别与检测,不仅从很大程度上能够缓解医疗资源的紧张,同时还可以避免人为因素导致的误诊、漏诊现象。尤其是在疾病爆发阶段,在面对大量医学影像时,利用计算机辅助医生进行医学图像的诊断,能够大幅提高诊断效率
近年来,随着科学和信息技术的飞速发展,各类系统的设计复杂度和各部件之间的耦合度也随之增加,系统的脆弱性问题逐渐显现,故障对系统的正常和安全运行造成不可忽视的威胁。为了提高系统对自身故障情况的监测和应对能力,学者们提出了自愈控制的思想。目前自愈控制仍然处于初级发展阶段,并没有学者给出自愈控制的明确定义和研究范畴等基本概念。在学术界对自愈控制理论的研究才刚刚起步,自愈控制理论的研究是滞后于自愈控制的工