基于图像处理的碎纸片拼接数学模型分析

来源 :科技致富向导 | 被引量 : 0次 | 上传用户:TomasZhang_888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】传统上,破碎纸片的拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。对于这类边缘相似的碎纸片拼接,理想的计算机拼接过程应与人工拼接过程类似,及拼接时不但要考虑待拼接碎纸片边缘是否匹配,还要判断碎片内的字迹断线或碎片内的文字内容是否匹配,然而由于理论和技术的限制,让计算机具备类似人那种识别碎片边缘的字迹断线、以及理解碎片内文字图像含义的智能几乎不太可能。本文建立的是一种基于碎纸片边缘文字特征的模型,通过计算机软件对纸片的预处理以及匹配算法的识别寻找到对应的相邻纸片,从而完成碎纸片的自动拼接工作。
  【关键词】二值化;误差控制;人工干预;自动拼接
  1.问题背景
  目前碎纸的拼接工作大部分是靠人工的方式完成,但是当碎纸片的数量巨大的时候,要人工拼接完成就很困难了。国内对此技术的研究主要是集中于文物碎片的自动修复、虚拟考古、故障分析以及计算机辅助设计、医学分析等领域,除此之外,破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域也有只重要的应用。
  常规的碎纸片拼接方法一般是基于碎纸片的边缘的形状特征比如尖点、尖角、面积等几何特征,再进行搜索与之相匹配的纸片从而完成拼接。但是这种基于纸片边缘几何特征的拼接方法,当存在许多边缘几何特征相似的纸片的情况下,这种拼接方法就不适用了,因此,本文重在建立一种基于纸片中文字特征的模型来完成碎纸片的拼接。
  2.问题分析
  碎纸片自动拼接技术是图象处理与模式识别领域中的一个较新但是很典型的应用,它是通过计算机扫描和图像提取技术获取一组碎纸片的形状、颜色、文字特征等信息,然后利用计算机进行相应的处理从而实现对这些纸片自动和半自动的拼接还原。碎纸片自动拼接技术的关键包括图像的预处理和匹配,其中预处理的目的是把碎纸片表示为适合于利用计算机处理的形式。预处理包括图像的获取和处理,对于边界特征明显的纸片可以进行边界检测,轮廓提取和表示。而纸片的匹配技术是碎纸自动拼接中关键之关键,即利用建立好的模型并设计出算法对纸片进行特征识别和自动拼接。
  问题中的碎纸片由于具有同样的边缘几何特征,因此不能采用常规的靠提取碎片边缘尖点、尖角以及面积的方式来对不同的碎片进行区分。对于这类边缘相似的碎纸片拼接,理想的计算机拼接过程应与人工拼接过程类似,及拼接时不但要考虑待拼接碎纸片边缘是否匹配,还要判断碎片内的字迹断线或碎片内的文字内容是否匹配,然而由于理论和技术的限制,让计算机具备类似人那种识别碎片边缘的字迹断线、以及理解碎片内文字图像含义的智能几乎不太可能。但是,利用现有的技术,完全可以获取碎纸片内部及边缘的文字几何特征以及纸片不同部分的颜色等信息,在自动拼接时,只要寻找到具有相同边缘特征的纸片即可。因此,解决问题的关键是设计出合适的匹配算法和进行误差控制。
  另一方面由于计算机数字分析图像能力的缺陷,让计算机对碎片进行完全意义上的自动化拼接是几乎不太可能的,为保证拼接的准确性,还需要在拼接过程中加入人工干扰过程。
  3.模型综述
  在碎纸片进行拼接之前我们要做的就是讲碎纸片使用扫描仪对纸质文档碎片进行处理,并输出BMP格式的原始图像。模型中我们先假设不存在边缘具有一模一样的文字特征的两张纸片,再对待拼接的碎纸片进行图像处理即二值化,转化为只含有0和1的矩阵,最后通过算法进行匹配找到对应的纸片。对于边缘相似的碎纸片的拼接,理想的计算机拼接过程不但要考虑拼接碎纸片边缘是否匹配,还要判断碎纸片内的字迹断线或碎片内的文字内容是否匹配,然而,由于理论和技术的限制,计算机要具备这样的人工智能还是很困难的,因此,还必须在相应的时间节点处加入人工干预。
  4.假设条件
  (1)假设不存在四个边界几何特征都一样的两张纸片。
  (2)假设碎纸片当中只存在黑白两种颜色。
  (3)假设正确拼接完成后的完整纸张的边界是全白的,即没有文字被切割。
  (4)假设纸张内的文字行是平行且单一的。
  (5)假设纸片内同一文字行的高度、间距是相等的。
  5.模型的建立
  二值图像是指每个像素不是黑就是白,其灰度值没有中间过渡的图像。二值图像一般用来描述文字或者图形,其优点是占用空间少,缺点是,当表示人物,风景的图像时,二值图像只能描述其轮廓,不能描述细节。这时候要用更高的灰度级。
  二值图像中所有的像素只能从 0 和 1 这两个值中取,因此在 MATLAB 中,二值图像用 一个由 0 和 1 组成的二维矩阵表示。这两个可取的值分别对应于关闭和打开,关闭 表征该像素处于背景,而打开表征该像素处于前景。以这种方式来操作图像可以更容易识别出图像的结构特征。
  建立将图片转化为二值化理想模型,方便进行数值处理。
  在碎纸片拼接中,通过计算一张纸片边缘一列的向量,与另一张纸片最边缘一列的向量,比较相似度的大小,找出邊缘最相似的矩阵进行拼接。同时,假设纸张内的文字行是平行且单一的,纸片内同一文字行的高度、间距是相等的,所以同一行碎纸片的上下空白高度具有类似的特征。
  6.算法设计
  (1)将每张图片先转化为矩阵,信息储存在矩阵中,再进行二值化处理,将每张图的信息储存在一个二维数组w(x,y)中。
  (2)求出每张图字符距离上下边缘的距离,存在两个数组cal_up与cal_down中。
  (3)先筛选出最左边或者最右边的可能图片,利用人工干预进行调整,排列出图片的第一列和最后一列,记录下正确的排序。
  (4)从第一列的第一张图片开始向后拼接,求边缘相减的最小值,进行筛选,直至最后第一列的最后一张图片。最后检查图片是否正确,记录下正确的排序。
  (5)从最后列的第一张图片开始向前拼接,直至最后第一列的最后一张图片,利用相同的算法,检查图片是否正确,记录下正确的排序。
  (6)对于仍然缺失的图片进行人工干预,最终补充完全。
  7.结论
  本文所提出的基于碎纸片边界特征的拼接方法,巧妙利用图像处理技术,使问题分析更加明显,简化,便于计算。对于大量的图片,具有结合人工干预,效率较高。分析表明,当碎片总数量较少时,拼接计算工作量在允许范围内,如果对算法作些改进,拼接计算量可大幅度减少。 [科]
  【参考文献】
  [1]罗智中.基于文字特征的文档碎纸片半自动拼接.计算机工程与应用,2012,48(5).
  [2]赵浩,李盼盼.规则矩形碎片自动拼接技术的设计与实现.计算机光盘软件与应用,2013.
  [3]孔灵柱,刘玉峰.基于边界序列数据匹配的一种拼合算法.吉林建筑工程学院学报,2014.
其他文献
【摘 要】在当前我国的经济得到迅猛发展的同时,电力系统也得到了很大的进步,电网的一些结构也愈来愈复杂,分布也逐渐广泛,对电网的维护工作就比较的麻烦,成本也在逐渐地增加,在二次设备数量逐渐增加的同时,继电保护在系统中所发挥的作用越来越大,在微机保护的全面使用下,装置自检水平也在不断地提高。本文主要就当前的继电保护装置状态检修问题进行详细地分析探究,希望能够对此领域的发展起到一定的促进作用。  【关键
【摘要】声乐教育是学前教育专业中音乐教育课程的基础学科,也是一门必修课程,这与其他专业的声乐教学目标并不一样。师范院校学前教育专业的声乐教学并不是为了培养出专业素质高超的人才,而是培养出优秀的幼儿教师。  【关键词】学前教育声乐教学问题改进  艺术教育是人们在自身素质发展过程中不可缺少的一部分,学前教育中的艺术教育是培养一名优秀幼儿教师实现良好发展的重要组成部分。学生在幼儿园中的歌唱技能是走向工作
正随着新课程改革的不断深入,化学课堂教学过程悄然发生着变化,但是许多教师提问方式与内容仍浮于表面、流于形式,还未能完全转变教学理念。本文主要围绕化学课堂提问如何更
生命中总有着太多太多的羁绊,无法抗拒,唯有学会承受,才能从容面对,才能微笑着迎接人生中的所有挑战!一直在告诫自己要学会承受,只有懂得了承受生活中的所有磨难,才能坚强地
【摘 要】数字电视系统从传输方式上来看大致分为有线数字电视、卫星数字电视以及地面数字电视系统。随着通信网、电视网和计算机网的相互渗透和融合,数字电视必将得到迅猛的发展。电视业务将延伸到更广阔的领域,数字电视传输的过程也随之更加趋于复杂化和多样化。本文分析了数字电视信号传播技术发展问题。  【关键词】电视信号;传播技术;数字电视  1.数字电视信号技术概述  所谓的数字电视系统(DTV:Digita
语文教学应强调学生的主体参与,学生只有主动参与才能获得发展,而发展又应当首先体现在创新精神的树立和实践能力的提高上.
1.回顾教材rn引导学生回顾课本,回归教材,从以前几次考试可以看出,我们的学生的基础比较差,写出的答案往往与标准答案有一定的偏差,这样十分非常可惜,所以,通过对教材的再次熟悉,从而
期刊
【摘 要】目前人们越来越重视建筑居住的舒适性,因此很多建筑工程都将暖通工程作为一项重要的施工项目进行施工作业,并积极采取各种先进的施工技术与性能更加良好的施工材料来提高暖通工程施工水平。其中电热采暖膜的应用就是这样一种先进的暖通施工技术,其不但能够提升暖通工程的供暖效果,而且更重要的是这种暖通施工技术更加节能环保,且不会对房建内部装修产生太大影响。现本文就从电热采暖膜的组成原理和采暖原理出发,来详
1933年,一位伦敦的医生为了科学研究在自己的睾丸上负重,我们现在搞不清这人究竟是赫伯特·伍拉德还是爱德华·卡迈克尔.虽然两个人一起做的实验,但是只有一人真正躺在桌子上
帕非佛紫色沙滩与美国加利福尼亚州大名鼎鼎的“加州一号公路”毗邻,公路的下面是大海,海洋的岸边就是沙滩。千百万年间,由于风浪的不断冲刷,帕非佛海岸上的紫色石榴石矿脉逐