一种基于连通域搜索的英文单词切分方法

来源 :哈尔滨理工大学学报 | 被引量 : 0次 | 上传用户:sibsiufeuhfhkshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英文文本识别系统中单词切分效果直接影响系统识别准确率.提出一种有效利用单词中的连通域以实现单词切分的方法,该方法首先对给定的图像文件进行扫描,搜索图像中所存在的所有连通域,然后根据连通域的坐标、尺寸等影响因素,对有效的连通域进行合并,并过滤掉噪声等因素所产生的连通域碎片,以实现有效的英文单词区域的正确分割,从而实现英文单词的正确切分.实验结果表明,针对相同的英文文本图像,该方法对英文单词切分的准确率达95%以上,与垂直投影切分法最高准确率27%相比有较大幅度的提高,证明该方法可以很好解决垂直投影法无法解决的字母之间相互交迭的单词切分问题.
其他文献
分析了钢制谐波齿轮传动存在的弊病及塑料谐波齿轮传动的优越性,针对提高塑料谐波减速器的承载能力对其啮合参数进行了优化设计,并根据优化结果制作了试验样机,验证了优化结果的
土壤水分是水文学、气象学、生态学以及农业科学研究领域中的一个重要指标参数,是农业干旱最为重要的环境过程因子,准确描述土壤水分动态变化是定量描述农业受旱的关键,对土
在FLUENT环境下完成了喷管内部流场的数值模拟计算与研究,通过工况的改变获取了以图线表示的系列相关计算结果,对计算结果的进一步比较与分析得出了流场分布与相关影响条件之
中国加入WTO以后,国外建筑施工企业逐渐进入中国建筑市场,增大了国内施工企业的压力和挑战,加剧了建筑市场的竞争。在国内,建筑施工企业大多存在工程技术与工程经济两相独立的情
源于军事通信的扩频技术在保密、抗干扰、低截获、高精度测量等方面有着不可比拟的优势。同样,GMSK(高斯最小移频键控)作为一种恒包络连续相位调制方式,它有着优良的频谱特性
物联网应用基于对智能物品对象的识别能力,RFID技术是物联网的核心技术,其企业应用不断得到发展。企业应用的多样性对传统RFID应用系统在拓展性、适用性和灵活性上提出了较高
随着日益严重的能源问题和环境问题使得人们对电能变换的效率、品质越来越关注,也引导了功率半导体器件沿着高效率、高频率、高耐压、高功率、集成化、智能化等方向迅速发展。
TK公司在正式经营的8年中,采用通卡行业惯常的收取清算佣金、沉淀资金安全增值、卡面广告收费和卡片押金(正常应该是出售卡片或租赁卡片)的商业模式,但在全国通卡公司中却成为少
印染废水具有水质复杂、污染物浓度高、色度高、pH高、可生化性差等特点,对环境的危害比较大。HABR(Hybrid Anaerobic Baffled Reactor)具有设计简单、适用范围广、抗冲击负荷强
Web2.0时代高校图书馆虚拟参考咨询服务方式不断创新,基于Wiki的高校图书馆虚拟参考咨询服务体系应用Wiki技术实现高校图书馆员与用户、用户与用户间的知识有效互动。高校图书