论文部分内容阅读
目前处理文档类资料大部分只依赖于Microsoft Word工具,进行人工检查.通过对docx文档使用解压缩算法后得到的文件发现,word文档是使用的开放式标记语言XML格式进行组织的,利用XML格式进行格式解析和检查判断可以充分利用计算机快速运算的特点,快速定位出违反规范文档格式规范的位置,并将相应格式错误的地方反馈给用户,便于用户进行自动化的格式检查核实.