一个基于规则的图书逻辑结构提取算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:maigcy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数字图书馆建设中,一个急需解决的问题是如何自动化地将海量的纸张图书数字化为电子文档,对于生成图书电子文档而言。除了文档内容信息以外,文档版面信息和文档逻辑信息同样重要。该文提出了一种基于规则的图书逻辑结构提取算法。从多页图书文档的模型描述出发,通过采用基于规则的推理方法,提取出图书中的逻辑元素并确定各元素间的层次关系和相互联系,从而得到了整本图书的逻辑结构。实验结果证明了算法的有效性。
其他文献
文章利用面向对象的编程技术,采用Delphi5.0语言,针对由不同数据库系统构成的知识库系统,实现了不同知识库系统的无缝连接,较好地解决了不同知识库系统的接口问题,为KDD中不一致知
文章针对软件工程中数据流分析技术的局限性,提出了一种基于工作流的新的软件需求分析方法-工作流分析方法,详细论述了该方法的理论基础、相关定义、工作流图的描述方法等内容,并
在电子商务迅猛发展,B2B的电子商务成为企业间协作的主流,工作流管理系统作为强大的使能工具在企业业务流程过程中起着举足轻重作用的时候,工作流管理系统的安全已成为人们关注
"社会支持"在特殊儿童养育过程中起着重要作用,"社会支持"不足不仅影响特殊儿童的教育康复,也影响特殊儿童家庭生活质量。我国特殊儿童的"社会支持"面临着资源不充分,法律保
按照世界卫生组织的定义,食品中具有的危害通常称为“食源性”危害。食源性危害包括了物理性、化学性、生物性危害以及转基因食品风险。全世界每年数以亿计的食源性疾病患者中
田野上自由延伸的小路,左边散落着一层薄薄的稻草,相同的稻草薄薄地遮盖着道路右边,都是为了纪念刚刚过去的收获季节。茂密的巴茅草,从高及屋檐的顶端开始,枯黄了所有的叶子,只在茎秆上偶尔留一点苍翠,用来记忆狭长的叶片如何从那个位置上生长出来。就像人们时常惶惑地盯着一棵大树,猜度自己的家族,如何在树下的老旧村落里繁衍生息。  我很清楚自己抱过父亲的次数。因为,这是我平生第一次抱起父亲,也是我最后一次抱起父
MANET是一种由一系列可以自由移动的节点主机聚集而成的一个临时性动态网络。由于其拓扑的动态性,其路由协议与其它传统网络有着很大的区别。传统的MANET路由协议都在路由破裂
讨论了数据挖掘的产生,定义,操作对象和分类方法,论述了数据挖掘可以挖掘的模式及其兴趣度,简要介绍了几种流行的数据挖掘系统,最后提出了挖掘研究今后的若干发展趋势。
文章根据对嵌入式Internet技术的最新研究与开发,概括阐述了嵌入式系统连入Internet的方案,分析了嵌入式TCP/IP协议栈与操作系统TCP/IP的不同之处,指出了基本设计原则,并探讨了嵌入
奶牛日粮中的纤维不仅为动物提供能量,还具有刺激咀嚼活动、维持瘤胃内环境稳定的功能。物理有效中性洗涤纤维(peNDF)兼顾了日粮物理特性和化学特性,能更准确的评估日粮纤维