基于Tesseract-OCR的复杂发票自适应识别

来源 :南京信息工程大学学报(自然科学版) | 被引量 : 0次 | 上传用户:hsq650
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对复杂发票任意区域下的特定表格内容提取与实时识别问题,提出了一种基于Tesseract-OCR引擎的自适应识别方法.首先利用OpenCV对发票图像进行预处理滤波、自适应阈值等一系列预处理得到二值图像;然后利用形态学中的开运算提取表格全域线段,进行表格位置提取,并结合表格交点坐标与自定义模板,实现表头与内容自适应适配;最后利用jTessBoxEditor对表格区域内容进行字库训练优化,最终实现基于Tesseract-OCR的字符识别.实验结果表明该方法具有高准确识别率,支持感兴趣区域自适应识别,具备
其他文献
[目的]海上油田群电力主要来源于发电机组,存在供电可靠性差、发电效率低和节能减排压力大等问题,通过陆上向海上供电可以很好地解决上述问题。[方法]根据功能定位和工作原理,可将海上降压变电站分为220 kV开关设备区、变压器区、35 kV开关设备区、10 kV开关设备区、无功补偿区和辅助房间六大区域。通过对各区域的研究给出了推荐的布置方案。[结果]给出的布置方案对提高海上降压变电站的可靠性、保障设备检修和维护便利以及最大程度减少平台尺寸具有重要作用。[结论]提出的布置方案能够对油田群项目中的海上降压变电站起到
[目的]稳压器比例喷雾阀是压水堆核电机组的关键阀门之一,是电站系统中唯一的核安全1级控制阀,掌握该阀门的技术特点对于工程实践和该阀门的自主化研发具有指导意义。[方法]基于国内压水堆核电机组所用的两种典型结构——气动V型球芯式比例喷雾阀和电磁驱动角式比例喷雾阀,从结构设计、工作原理及运行维护等方面进行对比分析。[结果]经过分析得出,两种结构型式的比例喷雾阀适用的技术路线不同,但均可实现核电站稳压器系统所需的喷淋控制功能,用户可根据核电厂的技术路线和具体需求选择相对适宜的产品。[结论]但在未来新建核电市场中,
首先分析了磁悬浮球绕组磁力线扭曲特性,构建了含轴向和水平两自由度的磁悬浮球运动模型,采用模型转换,将系统中的匹配性和非匹配性干扰统一重构为匹配性干扰,建立新的系统状态空间方程;其次,针对悬浮气隙中气隙速度与加速度难以获取、干扰实时性观测困难的问题,提出了含干扰重构的气隙速度、加速度滑模观测器,并基于此观测器设计了滑模跟踪控制器;最后搭建含干扰重构的滑模状态观测和跟踪协同控制仿真平台,结果表明所提控制策略在动态响应速度、跟踪误差和抗干扰能力性能方面优于传统PID控制.
三电平逆变器拓扑结构简单、所用器件较少且每个功率管所承受的电压应力小,适用于高电压、大容量的场合.相比于传统两电平逆变器,三电平逆变器输出电平的数量从2变成3,输出的电压电流谐波含量低,波形正弦度更好.本文提出内置式永磁同步电机模型预测电流控制算法,以提高控制系统电流动态响应速度,并针对该算法在控制系统中产生的时间延迟,引入二阶延迟补偿策略.对以上内容建立系统仿真模型,仿真结果表明:三电平逆变器相比两电平逆变器输出电流波形谐波含量更小、电机的动态及稳态性能更好.
为弥补智能制造、机器人工程等新专业实验装置短缺、学生创新实践能力亟待提升等问题,本文设计了一种基于双目视觉的双臂协作教学机器人.双臂机械部分设计呈对称结构,底座大而稳定,可以降低制造成本及协作抓取难度;研究设计的示教动作还原算法和重投影误差最小化算法,可以提升机器人末端位姿数据采集精度,使双臂协作抓取更准确稳定.该系统不仅能够通过上位机拖动控制双臂运动完成示教编程及动作组实验,而且还能够进行基于视
移动载人月球车相关技术的研究是我国未来载人登月探测的重要任务.根据载人月球车的需求,本文从航天员操作舒适度和操作工作空间出发,设计了一种面向载人月球车操作的力反馈手柄,在具体的场景设计下可以带给航天员力触觉感受,辅助航天员进行安全、有效的驾驶行为.基于力反馈手柄的移动载人月球车操作控制系统包含力反馈手柄、硬件系统、软件系统.力反馈手柄主要由二自由度旋转机构、手杆、带光编码器的直流电机组成;硬件系统
视觉里程计(Visual Odometry)作为视觉同步定位与地图构建技术(Visual Simultaneous Localization and Mapping)的一部分,主要通过相机传感器获取一系列拥有时间序列图像的信息,从而预估机器人的姿态信息,建立局部地图,也被称为前端,已经被广泛应用在了多个领域,并取得了丰硕的实际成果,它对于无人驾驶、全自主无人机、虚拟现实和增强现实等方面有着重要意义
[目的]超高压输电线路的安全稳定运行对电网安全至关重要,在电网规划建设中、新建变电站对原有长线路解口构网时,可能出现以下问题:如线路的三相不平衡电流不满足整定要求、线路高抗过补偿而产生过电压等,这些问题严重威胁电网的安全稳定运行,必须予以解决。[方法]为了解决上述问题,利用电磁暂态软件ATP-EMTP,依托同塔双回500 kV输电线路工程实例,对线路中出现的不平衡电流与过电压等进行仿真研究,以探究这些参数的影响因素与变化机理,进而提出应对方案。[结果]仿真结果表明,影响同塔双回线路不平衡电流的主导因素包含
以江苏宝应生态渔业光伏发电“领跑者”示范基地为研究对象,定量分析了不同辐射指标对渔光互补光伏发电效益的影响机制.结果表明:太阳辐射对渔光互补光伏电站发电效益有着显著影响,且存在季节性波动,在夏秋季日并网峰值及发电量较大,稳定性较高,而冬春季发电效益和稳定性较差;太阳辐射指标与日并网功率最大值相关性较高,且呈明显对数关系,而日发电量与太阳辐射指标呈明显线性关系;不同月份并网功率最大值和发电量与平均辐照度、最大辐照度和累计辐照量均呈正相关关系,影响月并网功率峰值最为明显的是最大辐照度,而影响月发电量最为明显的
在人机交互领域中,人手的位置信息往往直接用于交互指令的解读与交互结果的计算,因此高精度的实时人手位置检测是实现非接触式的、自然的人机交互的重要基础.针对Kinect 2.0追踪人体骨骼点获取的三维坐标数据的波动和误差较大的问题,本文提出了基于相关点均值处理的人手位置检测算法.该算法基于深度信息,以手腕为分割阈值点,进行人手图像分割,并对人手位置信息相关点进行空间平均处理与时间平均处理,提高位置检测