连体段特征聚类的维吾尔文文档图像单词切分

来源 :计算机工程与设计 | 被引量 : 7次 | 上传用户:rocklysun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为有效解决文档图像中单词漏切分和过切分问题,分析维吾尔文文档图像的无嵌入式双栏版面特性和文字特点。综合考虑连体段位置信息、密度及高宽特征和相邻连体段重叠性,提出一种文档图像中精确切分完整单词块的方法。将图文混排的版面分析与重叠域合并相结合,采用两级K-means分类策略,有效避免标点符号的影响,增强完整单词块的被切分能力。实验结果表明,该算法比连通域搜索算法和投影算法具有更高的切分精度,在多文种图像单词切分中具有更高的有效性。
其他文献
This paper investigates the performance and the results of an evolutionary algorithm (EA) specifically designed for evolving the decision engine of a program (w
期刊
期刊
目的了解和掌握厦门地区历史鼠疫流行情况,为预防和控制鼠疫提供依据。方法分析《福建省鼠疫流行史》以及相关资料汇编记载厦门历史人间鼠疫的流行和动物鼠疫监测情况,分析厦
期刊
以不同类型水稻品种为供试材料,研究了水稻生长后期不同氮肥水平对稻谷产量及稻米品质的影响。结果表明,后期增施氮肥,能提高水稻每穗粒数、每穗实粒数、结实率和千粒重,从而
期刊
期刊
期刊
期刊