论文部分内容阅读
市场全球化的趋势使得市场竞争日益激烈,跨行业、跨区域的企业制造模式已经逐渐形成。作为一种跨平台、网络化、服务于企业的建模和管理工具,ERP(企业资源计划)的概念应运而生。ERP系统集信息技术与先进的管理思想于一身,成为现代化企业的运行模式,为全球企业所广泛应用。在ERP系统中,数据的异构会导致不同应用模块之间数据加载的困难,因此ERP中的A2A和B2B数据交换往往采用XML作为数据载体。本文从ERP系统中XML数据量大、安全性要求高的角度出发,针对XML文档的结构冗余所带来的网络通信带宽问题,对ERP环境下的XML压缩算法和安全技术作了分析和研究,主要完成了以下工作:现有的支持查询的XML压缩算法存在不足,如XGrind算法,往往需要DTD文件来辅助编码,而ERP系统中未必包含与XML文档对应的DTD文件;另外XGrind需要扫描XML文档两次来完成压缩,从一定程度上影响了算法的压缩效率。针对以上问题,本文提出一种基于Lempel-Ziv编码的支持查询的XML压缩算法(简称ELZ):该算法无需借助DTD文件,适用于ERP系统中没有DTD定义的XML文档的压缩:ELZ只需一次扫描XML文件即可完成压缩,较XGrind缩短了处理时间;算法采用了同构转换的策略,将文档结构和数据分离,分别进行编码,使得压缩后的文件仍然支持查询;ELZ对文档的数据部分,采用数据类型相关的压缩算法。为了提高ELZ算法的压缩率,本文随后提出了改进的压缩算法EHF。该算法借鉴了Huffman编码的熵编码思想,在压缩数据之前,先分析XML文档中元素/属性出现的频率,再构造Huffman树,较ELZ产生更合理的编码,压缩率提高5%~10%。在XML的数据保密性方面,本文分析了CRT-RSA公钥密码算法,首次从理论上证明了:Wiener提出的连分数攻击算法对CRT-RSA是无效的;在数据可靠性和一致性方面,基于Merkle算法设计了ERP中的XML安全验证方法。最后本文结合上述提出的XML压缩算法和安全技术,实现了一个适用于ERP环境的XML数据交换系统,并在SAP的内部管理系统中得到应用和测试,去除了XML压缩算法需要借助DTD的瓶颈,压缩时间较XGrind算法减短了30%。