论文部分内容阅读
随着现代企业信息化进程的不断推进,信息量越来越庞大。非结构化数据的大量涌现,使得对数据的管理变得更加复杂。企业中的许多信息以非结构化的形式分布在企业各个角落,包括各种报表、电子文档、图片图像,以及大量的多媒体音频、视频信息等,这些信息对于企业决策起着越来越重要的作用。传统信息管理技术已经无法适应非结构化数据管理的需求,在这样的背景下,内容管理和内容管理技术受到了人们的关注。内容管理是现代数据管理发展的新方向,内容管理由“内容”和“管理”两个部分组成。内容是一个比数据、文档和信息更广泛的概念,而内容管理就是施加在“内容”上的一系列处理过程。内容管理重点在于解决各种非结构化或半结构化的数字资源的采集、管理、利用,并集成到结构化数据信息系统中,从而为应用系统提供更加广泛的数据来源。本文在对内容管理及相关技术进行分析研究的基础上,针对企业非结构化数据的管理需要,进行了以下几个方面的研究工作。第一,提出一种基于NativeXML数据库的内容管理解决方案,引入元数据,通过元数据描述各种非结构化数据,从而进一步支持对非结构化信息的访问和检索。在本文的研究中,选择Native XML数据库存储和管理元数据。第二,Native XML数据库支持XQuery查询语言,对关键词查询不能提供有效支持。通过在Native XML数据库系统上构造一个基于关键词的查询接口,接受用户输入的查询关键词,然后自动转化成可执行的XQuery查询表达式,由Native XML数据库系统的XQuery引擎执行查询表达式,从而实现对Native XML数据库的关键词查询处理。第三,讨论元数据库的设计。本文的元数据库由XML模式和一组相关XML实例文档组成。最后,在Native XML数据库系统的关键词查询接口和元数据库的基础上,讨论了内容管理系统原型的设计与实现。本文的研究工作表明:将Native XML数据库引入到企业内容管理中,能够有效的存储和管理内容管理中的元数据,从而更好的支持对企业非结构化信息的访问及检索。本文的研究工作为企业内容管理方案提供了一种新的方法,能够更进一步促进内容管理的发展及应用。