基于投影算法的自适应中文版面分析方法研究

来源 :光盘技术 | 被引量 : 0次 | 上传用户:sunliu168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主要研究学术期刊类版面的分析方法,通过版面分析,将文档版面进行分割,划分出页眉以及主体版面的各个段落、标题。在页眉检测阶段,运用直线检测方法,检测页眉下方的一条直线,进而分割页眉与主体部分。在主体版面分析方面,采用投影轮廓算法思想,结合版面先验知识,采用自适应的阈值设定方法,划分版面的各个段落及标题。所采用的版面分析方法运算量较小,算法效率较高。
其他文献
本文主要分析了我国商业银行财务管理信息化的必要性,及目前建设过程中存在的问题,同时提出大力推进我国商业银行财务管理信息化建设的对策和建议。
本文以舆论信息的获取为例说明互联网中获取信息的内容与方式,阐述了利用互联网获取信息的特点。
本文对搜索引擎的分类和工作机理进行了讨论,并探讨了搜索引擎存在的问题、搜索引擎技术研究热点及其发展趋势。
随着技术的进步和网络的发展,数字化校园的建设已成为衡量高等院校教学水平高低和管理水平的重要标志,本文针对该系统建设实现的复杂性,在理论层面上对数字化校园建设的功能
黑龙江省老柞山金矿床位于兴蒙造山带东段佳木斯地块的中北部,矿体主要赋存于华力西期花岗岩和燕山期闪长玢岩中,断裂控矿明显。老柞山金矿床属于矽卡岩-热液脉型金矿床,热液成
位于东昆仑中段五龙沟地区深水潭矿段糜棱岩化钾长花岗岩LA-ICP-MS锆石U-Pb年龄为(390±3.9) Ma。该岩体具有较高的SiO2(74.86%~76.64%)、K2O(5.20%~6.06%)和全碱含量(K2O+Na2O=8
介绍了EWSD话务统计和分析,对突发性峰值话务的处理及控制进行了探讨.
石秤岩体是王屋山期岩浆活动形成的碱性岩体,其稀土元素特征为:ωEREE约为地壳丰度的6.0倍,ωLREE/ωHREE为地壳丰度的近1.5倍,轻重稀土分异程度低,δEu呈强负异常,基本无δCe异常,侵入
东昆中构造带具有复杂的物质组成与结构构造,其中沟里地区出露的原划石炭系浅变质沉积地层是东昆中蛇绿构造混杂岩基质岩系的重要组成部分,其形成时代和属性研究对东昆中构造
利用遥感数据提取蚀变矿物的基础就是熟知不同岩石和矿物的光谱吸收特征,尤其是要掌握不同物理、化学环境下岩石和矿物的光谱变异特征。北山方山口地区地质演化历史复杂,蚀变岩