HTML表格向XML的智能转换

来源 :计算机工程 | 被引量 : 0次 | 上传用户：Ivy1234

【摘要】

：

XML已经成为处理与管理信息的标准格式，而HTML表格被广泛应用于Web。为了充分利用与管理HTML表格信息，需要将HTML表格转换成XML。提出一种有效的处理方法，该方法包含2个部分，即表

【作者】

：

贾长云程永上

【机构】

：

淮海工学院计算机工程学院,河海大学计算机与信息工程学院

【出处】

：

计算机工程

【发表日期】

：

2009年14期

【关键词】

：

HTML表格结构分析规范化信息提取可扩展标记语言 HTML table structure analysis normalization informa

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

XML已经成为处理与管理信息的标准格式，而HTML表格被广泛应用于Web。为了充分利用与管理HTML表格信息，需要将HTML表格转换成XML。提出一种有效的处理方法，该方法包含2个部分，即表格识别与结构转换。表格识别通过检查格式、语法及语义的特征将表格提取出来并分割成值域与属性域，使用预设的表格模板分析属性域与值域间的层次结构并将其转换成XML格式。通过 300多个表格的实验表明，所提出的方法要优于传统方法，结果的准确率达86.7%。

其他文献

地方本科院校教师队伍结构优化问题研究

国际21世纪教育委员会报告《教育——财富蕴藏其中》指出,“在传授人类积累的关于自身和自然的知识方面以及开发人类创造力方面,教师始终是主要责任者,始终起主导作用”。高

学位

地方本科院校教师队伍结构结构优化

UHMWPE的相对分子质量与力学性能的关系

分析了超高相对分子质量聚乙烯的相对分子质量与力学性能的关系。结果表明，相对分子质量对拉伸强度的影响不大，而断裂伸长率随相对分子质量的增大而降低；常温冲击性能、弯曲性能

期刊

高密度聚乙烯超高相对分子质量力学性能high density polyethylene ultra-high relative molecular mas

JMF消息通信在印刷系统中的应用

为了使印刷制造系统中的设备间能进行即时消息通信，在分析“询问-响应”和“信号”的作业消息格式（JMF）的消息通信基础上，给出基于B／S的计算机集成印刷系统。应用结果表明，通过套接

期刊

可扩展标识语言作业消息格式简单对象访问协议套接字eXtensible Markup Language（XML） Job Message Format（J

中国金融危机预警：基于Logit模型的实证分析

上世纪70年代以来,国际金融体系遭受了一次次的冲击,世界各国频繁发生金融危机。尤其在2006年,发生于美国的次贷危机引发了全球性的金融危机,给社会带来了巨大的经济损失。中

学位

金融危机Logit模型预警政策建议

信息系统可生存性定量评估的指标体系

从内容、攻击阶段、测定标准等不同角度综合分析可生存性指标，提出一种能系统地反映可生存性的指标体系，给出其形式化描述和数学模型。分析与验证结果表明，该指标体系具有规范性

期刊

可生存性定量评估指标体系形式化描述survivability quantitative evaluation index system formal s

深圳海上危险品应急指挥船功能定位及技术路径

考虑到深圳海上危险品应急指挥船设计定位高,许多技术应用在国内处于空白阶段,缺乏相应的技术规范前期研究、论证及评审,分析指挥船在工程技术上的可行性,探讨设计中碰到的问

期刊

海上危险品应急指挥船功能定位结构设计技术进步

基于语言文字运用的文体教学模式研究

摘要：随着新课标改革工作的不断推进，我国对教师的教学方式有了更严格的要求与标准，然而目前部分教师受传统教育观念影响，仍采取已经过时的、老旧的教学方法来教导学生，严重影响了教学工作的进一步开展，不利于学生的各方面发展。因此本文以小学语文为例，基于语言文字运用进行文体教学模式，从而促进学生的全面发展。　　关键词：语言文字；运用；文体教学模式；研究　　文体，是指独立成篇的文本体裁或样式，是由多个文本构成

期刊

语言文字运用文体教学模式研究

HTML表格向XML的智能转换

其他学术论文