古代汉字文献切分研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:an123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对古代汉字文档的特点,提出了适合于古文档的列切分方法和字切分方法。提出的列切分方法直接对文档的笔画投影进行分析,采用一种基于分层投影过滤和变长间隙阈值的递归切分算法。该算法在列间隔较小、列与格线存在粘连、文档具有一定程度的倾斜的情况下,也能准确地抽取出列,尤其对短列的切分达到了较好的效果。提出的字切分方法分为两步,进行粗切分确定大致的切分位置,采用基于连通域分析与粘连点判断的方法做进一步的细切分。该算法对具有较多粘连和重叠汉字的列,也能较好地切分出完整的单字。实验结果表明,提出的方法用于古代汉字文档切分
其他文献
信息通信技术是二十世纪以来人类社会发展最快、应用最广、影响最大的关键技术。在技术和市场的双重驱动下,通信的基本特征发生了根本性变化,通信业务逐渐从窄带话音业务转变为
针对火灾场景图像容易受到噪声干扰、光照变化等干扰因素的影响,难以实时有效地提取出火灾运动区域的问题,设计了一种适合于全天候高效工作的火灾火焰运动区域的快速提取算法,该算法根据像素点灰度信息分布和序列帧相关性,从时间域对背景模型和阈值进行自适应更新,并利用投影原理的二维统计原理,在基于运动目标区域空间相关性的基础上,实现了对火焰疑似区域的快速提取。实验结果表明,在1 920×1 080分辨率下,该算
针对具有超重尾特性的语音信号,提出了混合拉普拉斯分布语音模型。从理论上探讨了混合拉普拉斯分布模型的参数估计,从原理与算法得以实现。通过最大期望(Expectation Maximizati
该机是河北神耕机械有限公司自行开发研制的适应于配套大功率(73.5kW以上)拖拉机的大型折叠变速旋耕机具。该机从根本上解决了配套540-1000r/min动力输出轴的转速问题,又满足了在
北京2008年奥运会的举办,是全体中国人期盼已久的一件大事。作为在北京地区有百年通信服务经验的主导运营商,中国网通以高度的政治责任感支持奥运的申办和筹办,努力为举办一届“
山东省定陶县农机局和菏泽明庆机械有限公司联合研制的4JQM-110型玉米秸秆切碎灭茬还田机,是国家专利产品,实用新型专利号:ZL200520125465.6,配套动力36.8-58.8kW拖拉机,三点悬挂,双行