基于超文本标记语言的文档信息自动提取技术研究

来源 :粘接 | 被引量 : 0次 | 上传用户:wacolt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章研究探索了如何使用文档分解(文档结构研究),文档标记(具有可扩展标记语言(XML)),超文本标记语言(HML)和可伸缩矢量图形(SVG),以及多方面的分类机制。文档内容提取是通过计算机编程(使用Java)实现的。在这项研究中开发的文档信息自动提取技术证明:作为信息提供者,可以使信息用户(包括工程师)以更易于访问的方式制作文档内容。
其他文献
晏欧词自北宋至今,约有千年的研究历史,而20世纪以来的110余年无疑是这个研究史中最为丰富最为光彩的一页。以1949年为界,这个百余年研究史大致可分为四个研究阶段,借助数据
针对中煤鄂能化蒸汽动力汽轮机抽汽不足、减温减压量大、夏季低压蒸汽放空多等问题,对蒸汽系统进行建模与优化。介绍了模拟系统的建模方法和技术原理,通过系统模拟,对全厂蒸
在绿色化工发展大趋势下,面对传统化工企业"小、散、差"的现状,亟待通过双创活动谋求新的突破。而产业聚集的双创活动可促使化工企业抱团、实现优势互补,以提升整个业态水平,
摘要:在传统生产领域中,我们看到的先进继电器操作系统为继电接触器,此设备在现代生产工作中已经无法满足高质及先进的工作需求,所以只能够被应用到基层、低端机床设备中。但是PLC技术的出现为机床电气控制系统创新提供了全新的方向,此也是划时代的发展主题,其和传统继电接触器对比具有较高的工作效率,良好的稳定性。基于此,本文就从PLC概念入手,简单分析其在机电机床电气控制中使用情况和设计要点。  关键词:PL