基于Huffman编码的XML文件压缩存储算法研究与实现

来源 :软件导刊 | 被引量 : 0次 | 上传用户:tdwh14226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(可扩展标记语言)是一种广泛应用于网络的数据存储交换格式,采用通用标记语言,具有良好的数据存储和分析能力,其缺点是XML文档存在结构冗余。伴随着XML在网络上应用的扩展,XML压缩成为目前关注的研究问题。从压缩、存储两方面研究了XML文件的压缩算法。根据重复出现权重,基于Huffman树生成对应的编码(0、1数字表示),减少XML文件结构重复导致的冗余。存储文件时,把n位编码(二进制)转化为一个ASCII字符存储(n不是8倍数即补位),节省了存储空间。大量实验证明:算法具有良好的可行性和研究价值。
其他文献
综述了我国土壤重金属的污染现状,总结了重金属污染土壤植物修复的类型、典型案例及局限性,重点概括了植物修复的核心——超富集植物的研究现状,并对植物修复的发展方向进行
实证层面利用2003-2015年中国283个地级及以上城市的动态面板数据,采用系统广义矩估计方法,分析交通基础设施对城市就业增长时空演变的影响。结果发现:(1)交通基础设施对城市
由于XML(extensible markup language)本身是自描述的,所以XML数据流中存在大量冗余的结构信息.如何压缩XML数据流,使得在减少网络传输代价的同时有效支持压缩数据流上的查询
为了西陵峡地区地质旅游资源全面合理的开发与利用,通过对长江三峡西陵峡段的地质旅游资源进行分类,把该地区的地质构造和地层关系与自然、人文旅游资源的分布相结合,综合分
<正> 近年来,在教育领域,高等院校、中小学校均己有比较典型和成熟的校园网建设方案,而中等专业学校的校园网建设方案却鲜有文章提及。做为一所中等专业学校,需要的是比较实
医生的视觉感知信息与影像诊断联系紧密,如何有效利用该信息以提高医学影像辅助诊断中的决策准确性,是一个具有前沿性和实际临床价值的研究课题。针对医生临床诊断时其视觉感
公司捐赠是公司应负的社会责任的主要内容,对提高公司形象、促进社会财富的再分配和营造良好的公司文化具有重大作用。我国未来的公司捐赠立法应从激励和制约两个方面加以完
中国与印尼的经济发展水平类似,两国经济既有分工又有竞争,本文对加强中国与印尼的经济合作进行了深度思考。从贸易角度,巩固商品贸易,深化服务贸易协议,增加贸易便利化措施;
<正>前些年,递推数列曾是高考的热点试题,这几年高考试题中已比较少见,今年安徽卷(理科)出了一道非线性递推数列作为压轴题(第21题),多少有些使人感到意外!在《普通高中数学
北京作为我国首都,其政治,经济地位的重要性是毋庸置疑的,任何危机在此发生造成的影响和损失都是非常巨大的。"7·21暴雨"的强势来袭,对北京与世界顶级优秀城市相差几何提出