数字图书馆--文档图像的检索

来源 :沈阳理工大学 | 被引量 : 1次 | 上传用户:lichangsong3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字图书馆的飞速发展,图书馆的信息采集、加工(分类、编目)、形成MARC记录、提供二次文献检索等手段已很难满足用户的需求。信息检索技术已由字段检索、全文检索向内容检索、搜索引擎等方向发展。其中大量信息是文本图像。本文就是基于内容的针对文档图像的检索进行的研究。通过机器自动提取图像的内容作为检索特征,并利用相似性度量算法进行的近似匹配。本文主要从两个方面进行论述,一方面从理论的角度讨论了文档图像检索的原理和模型,并结合原理和检索模型对检索系统中各主要部分的算法进行研究。另一方面,从系统实现的角度对检索平台进行了说明。本系统检索算法中主要有四大部分构成:文档图像预处理,汉字图像分割,特征提取及匹配,用户端检索。采用阈值法二值化对文档图像进行预处理。针对文档图像的特点,采用投影法,将汉字图像分割为单个汉字块儿图像,在此基础上,采用改进的模板对其进行细化,实验效果较好,细化毛刺明显减少。主要介绍了六种特征提取方法,对比传统的方法,本系统采用一种基于骨架特征和点阵特征的二级特征提取及匹配策略,使识别率和识别速度都较为理想。在用户端检索端,可以实现字级检索以及图像检索的双重检索,按照相似度输出检索结果。采用VC++软件平台编程实现系统,对实验建立的图像库进行检索,查找率达到96.5%,识别率较高,具有一定的鲁棒性和实时性。
其他文献
本论文介绍了线状目标识别与跟踪的基本方法。目标识别方面,对多种直线提取算法进行了深入的研究,提出了基于伪方向的直线提取算法。该算法通过设计的3*3目标算子与边缘图像
中红外光源在军用及民用等多个领域具有极其重要的意义。稀土掺杂硫系玻璃是实现中红外发光的有效途径,但目前发光很微弱,寻求有效的手段来增强中红外发光显得格外重要。光子晶
传统的电磁场理论,着重研究的是电磁波随时间按正弦规律变化的稳态场,即时谐场。长期以来,研究时谐场的理论和实验方法已相当成熟。近些年来,对于与电磁脉冲有关的瞬变电磁场的传播规律的研究已引起了人们极大的重视。其中,导电媒质中似稳瞬态电磁场的研究是一个重要的研究领域,在地球物理勘探中有着重要的应用。三维数值模拟是研究瞬变电磁场在导电媒质大地中传播特性的重要手段。本文的工作就在于实现三维场的时域有限差分模
随着计算机软硬件技术的飞速发展以及计算机视觉应用领域的不断扩大,能够对现实世界进行快速准确数字化建模的三维重建已经得到了国内外学者的广泛关注。三维重建模型在模式
随着无线互联网与智能终端的飞速发展,通过无线网络传输实时视频信息的场景越来越多。在无线环境中,视频传输通常受到遮挡物,环境,天气以及信号自身衰减的影响,从而导致数据
如今以ARM处理器为主CPU的嵌入式硬件平台,几乎己经成为信息产业的硬件标准。一方面,它具有体积小、性能强、功耗低、可靠性高等特点;另一方面,它为高速、稳定地运行嵌入式操
根据最近几年的火灾事件统计资料表明:世界各国每一年都会有各类型的重大火灾事故的发生,造成的损失不可估量。我国也是一个火灾多发的国家,几乎每一年都会发生群死群伤的重
2D转3D是3D图像/视频内容制作的重要研究方向之一。随着高清显示终端和智能手机等的普及,3D显示的应用越来越广泛。但由于3D片源制作复杂、耗时长等原因,导致3D片源严重不足
现代包装中通常使用的条码都是一维条码,但是一维条码存在许多缺陷,无法更好满足包装在运输、存储和表达信息方面的要求。二维条码的诞生解决了一维条码所不能解决的问题,它能够
随着计算机的普及和通信网络技术的不断发展,军队通信网络技术管理中心作为军队话费管理的专职部门,长期以来普遍采取的是工作人员前台受理的工作方式,这种方式已经逐渐不能满足