论文部分内容阅读
本课题来源于南京某研究所合作项目"雷达故障传递模型建立及验证系统",由于研究所内资料具有很强的保密性,为避免网络传输造成的信息泄露,研究所提供的雷达故障资料大部分为纸质版表格形式。针对纸质版表格人工录入数据的工作量大、效率低问题,本文从表格图像处理、字符识别和表格还原三个方面进行研究,设计了一套完整的纸质版表格OCR系统。在表格图像处理部分,通过Shi-Tomasi角点检测算法和有向单连通链算法来提取表格图像四个顶点,并通过透视变换法实现图像矫正;采用K-means聚类算法和模板匹配法对传统的投影法