基于随机投影的场景文本图像聚类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lemon2513
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中的文本字符是描述和认知场景内容的关键线索,对场景视觉信息的表达和理解具有重要价值。由于场景图像中的文本字符存在于复杂的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存在光照变化、字符颜色不统一等,使用传统分割识别方法具有一定的局限性。本文对场景图像背景分离与字符识别的技术难点问题开展了深入的研究。鉴于文本区域的特殊性,颜色、纹理等全局特征的描述能力较弱,提出了使用SIFT和Affine-SIFT两种局部特征描述方式对图像进行特征抽取。由于使用以上两种方法得到的特征点数量太多,对后期处理的效率有很大影响,本文在SIFT算法中使用主方向与辅方向结合的特征挑选方法对特征点进行筛选,对Affine-SIFT算法采用图像自匹配的方法进行有效特征提取。由于图像不同,使得检测到的特征点数量也不同,无法直接通过特征点集评价图像间的相似程度,本文提出了一种基于随机投影的特征映射方法。该方法将图像的局部描述特征点作为输入,得到单个图像的特征矢量,保证了图像间相似性度量的可行性,与特征点匹配的方法相比,该方法效率更快。本文根据不同的数据集使用K-means和Affine propagation两种方法对图像进行聚类,并进行了对比实验。实验结果表明,本文方法可以对包含文字的自然场景图像有效地进行聚类,准确率能达到86.66%。
其他文献
随着信息技术的飞速发展,桌面计算机系统已经广泛的应用于家庭、公司、政府机关与军队中。桌面计算机系统保存了越来越多对个人和公司具有不可估量价值的数据。但是通用操作
top-k join查询返回用户最感兴趣的k个连接结果。近来top-k join已经成为一个重要的研究课题,其在Web数据库,信息抽取和数据挖掘中均有应用。星型模式的数据仓库在实际应用中
在大规模程序中存在许多隐式编程规则,它们表达了程序的内在特性和特定需求;如果程序员忘记或者未意识到这些规则,那么就很容易将缺陷引入程序。隐式编程规则形态多样,可能包
随着各组织间数据交换的与日俱增,作为Web上数据存储和交换格式事实标准的XML变得越来越重要,但是不正确数据、不一致数据、不精确数据等XML中的劣质数据给XML上的有效查询处
随着多媒体技术的发展,数码拍摄设备走进了千家万户,高质量数码图片呈指数型增长的趋势。人们总是希望能够按照图像的内容(语义)进行管理,因此按照语义进行图像分类对于图片数据
面对激烈的市场竞争,企业需要不断的自我完善才能快速响应不断变化的市场需求。企业管理软件作为业务系统内重要的支撑手段,也同样面临着不断变化的软件需求。如何使得企业管理
随着国际贸易的日趋频繁,我国物流行业得到迅速发展。海运货代作为物流业的重要组成部分逐渐发展壮大,已经成为一个比较有竞争力的服务行业。伴随我国海运货代的迅速发展,该
21世纪以来,现代社会的发展与进步,特别是信息技术的广泛应用,推动了我国医疗水平快速提高和医疗信息化建设迅猛发展。但与发达国家相比,仍然存在不小的差距,还远远不能满足
人脸是人们区分不同对象的重要特征之一。人脸识别技术的研究对计算机视觉与模式识别的发展和应用有着重要的意义。特征提取与模式分类是人脸识别系统的两个重要步骤,稳定的
虚拟战场地形环境仿真中,地形模型具有广泛而重要的作用。由于计算机硬件水平有限,制约了大范围三维地形建模的速度和精度。目前解决该问题的方法是基于软件的方法,从建模的角度