聚类+连体段判别的维吾尔文档图像单词切分

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:kaonub
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前针对印刷体维吾尔文档图像的切分研究主要集中在字母切分上,单词切分的文献较少,且存在着标点符号难处理,未合并被拆分书写的单词等问题,同时单词切分准确率有待进一步提高。在对文档图像进行投影处理的基础上,通过K均值聚类算法(K-means)对文本行中所有连体段之间的间隙进行聚类分析得出最佳的间隙判别阈值,然后对所有连体段进行筛选和粗略识别,并结合对间隙的阈值判别结果来确定单词的精确切分点和获取被拆分书写单词的位置信息。在选取的100张文档图像中测试时,结果表明该方法能有效去除标点符号对切分结果的影响,准确合
其他文献
目的布地奈德联合复方异丙托溴铵雾化吸入治疗慢性阻塞性肺疾病(COPD)合并Ⅱ型呼吸衰竭患者疗效及对血气指标、血浆脑利钠肽(BNP)水平的影响。方法选择医院2015年1月至2018年
目的研究急诊超声诊断老年急腹症的临床应用,并分析误诊原因。方法回顾性收集我院2017年6月至2019年4月收治的86例老年急腹症患者临床资料,以病理检查为金标准,计算超声检查
“从小小的机床制造做起,不断将梦想的触角延伸到大型高端铸件,宁夏共享集团开发成功的发电设备铸件等国家级新产品,不断填补了国内空白……”2月15日,从银川经济技术开发区获悉,
移动机器人在各种任务中需要进行建图、定位和路径规划,但是目前的视觉SLAM只能输出相机的运动轨迹图,而不能生成用于路径规划和导航的地图。因此,在ORB_SLAM2的基础上,与RGB-D相机相结合,提出了一种实时3D栅格地图构建算法。建立了一个逆传感器模型(Inverse Sensor Model,ISM);针对ISM模型,重新构建了3D栅格地图的算法;联合ORB_SLAM2进行数据集实验、仿真环境
针对目前航空安全事故因果关系分析一般采用基于概率和统计的方法,缺乏对事故发生过程的详细分析这一问题,提出通过因果关系抽取挖掘事故的因果发展过程。针对世界航空安全事
自动浇注机就是以机器视觉技术和线激光技术作为检测设备,扫描浇口杯中的金属液面,将浇口杯液面的情况反馈给控制器,形成一个闭环控制系统。控制器根据浇口杯中金属液面的高低,自
在水冷铜坩埚中采用铜型吸铸法制备成直径为3mm的Zr65-xCu17.5Ni10Al7.5Tix(x=1,2,3,4,5)合金圆棒。采用X射线衍射(XRD)、差热分析(DSC)对Zr基合金的非晶形成能力、结构变化及热稳定性
黑龙江省作为东北老工业基地,高技能人才在其经济、社会发展中做出了巨大贡献,并将发挥越来越大的作用。本文从职业技术教育角度入手,分析了黑龙江省高技能人才现状及就业存在的
“非主流”设计与“主流设计”相比较二者之间并不是矛盾对立的,而是相辅相成的。“非主流”设计的提出并不是要改变“主流设计方法”在现代工业生产模式背景之下的主导地位,而
当今,各行各业的竞争都相当激烈,“服务”已经成为企业的一种核心竞争力,很多企业几乎天天在强调要抓好服务质量,但很多年青人的服务意识却非常淡泊。职业高中的学生面临着毕业后