基于Tesseract中文全血化验单信息提取研究

来源 :电脑编程技巧与维护 | 被引量 : 1次 | 上传用户:learner1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计基于Tesseract引擎针对全血化验单内容的识别系统。利用混合边缘检测算子对图片进行边缘检测,排除背景噪声。通过透视变换、霍夫直线检测对图像进行倾斜校正,利用投影法切分不同类型字符识别区域,对切分的项目名称和结果利用二维OTSU (大津算法)法对相应的图像进行二值化。利用Tesseract引擎使用集束搜索算法和K-近邻算法(KNN)进行预识别,经过校正后,重新训练生成全血化验单识别字库,利用生成字库进行识别。经过实验,该系统识别率为96.4%。该系统的实现,弥补了市场空白,避免手动输入的繁琐,
其他文献
系统的介绍了钢管混凝土拱桥在大跨结构中的运用优势及施工方法和施工工艺。并指出了钢管混凝土作为一种新型桥梁结构具有良好的发展前景。
期刊
大学英语四级考试改革后听力比重加大,这意味着教师在听力教学过程中应该进行听力学习策略的培训和听力技巧的训练,以提高学生听力水平。在四级听力教学中,情感策略的整合运
随着电力市场的发展,机组负荷优化分配作为一种可提高电厂经济性的手段,越来越成为一个令人感兴趣的研究课题,但目前仍没有得到一种绝对严格的算法.本文引入模糊理论提出了电
目的:探讨老年喉癌患者围手术期的护理方法。方法:对15例老年喉癌病人围手术期护理进行分析。结果:经过心理护理、术前、术后护理,15例老年喉癌病人均恢复较好,痊愈出院。结论:老年