论文部分内容阅读
XML(Extensible Markup Language,可扩展标记语言)是由万维网联盟(WorldWide Web Consortium,W3C)定义的一种标记语言,由于其跨平台、与软硬件无关的特性,目前已被广泛用于组织、存储和交换信息。DOM(Document ObjectModel)是目前为止唯一成为W3C正式标准的XML数据表示模型。DOM的特点是将XML文档完全加载到内存中,并组建一棵DOM文档树,用户可以对这棵DOM树进行各种操作。除了DOM核心模型,W3C还定义了DOM Load andSave、DOM Event、DOM Traversal、DOM Range等相关扩展规范,分别规定了DOM文档的加载和序列化、事件触发机制、DOM文档遍历和编辑模型。不少主流的XML编辑器和浏览器都支持部分DOM扩展规范。
本文在已有的DOM解析器OnceDOMParser1.0的基础上研究了DOM解析、操作和序列化的特点,实现了支持DOM Level3 Core、DOM Load and Save、DOMEvents、DOM Traversal和DOM Range规范的OnceDOMProcessor1.0。OnceDomProcessor1.0在存储结构和实现流程等多方面进行了优化设计,提高了系统性能,此外系统设计还使用了大量的设计模式,增强了系统的复用性和可扩展性。
OnceDOMProcessor1.0通过了W3C提供的DOM Level3 Core的API兼容性测试以及Level3 Load and Save API兼容性测试。利用Sun提供的XML Test进行的性能测试表明,OnceDomProcessor1.0比Xerees2.7性能高出28%左右。本文作者还对Load and Save模块进行了性能测试,测试结果表明OnceDOMProcessor1.0的Load and Save部分的性能较Xerces的相应模块分别高出15%和35%左右。这说明OnceDOMProcessor1.0不仅功能完善,而且具有高效的解析性能和序列化性能。