论文部分内容阅读
互联网信息资源整合(Web Integration)是一门涉及面广、综合性强的新兴研究领域,它与数据库、人工智能、信息系统等学科有着密切的关系,同时,也为这些学科领域带来了新的研究内容。尽管有关Web信息访问和数据整合的研究沿着不同的方向、基于不同学科的方法已经开展一段时期,但是目前还未形成一个系统的方法和结论、仍存在一些没能解决的问题。本文指出数据模型、知识表示和处理、实用性和自动化处理能力是WI系统的关键问题。在此基础上对WI进行全面的研究,获得以下研究成果: (1)以本体模型(ontology)为指导的WI系统方法和结构。 (2)演绎的带有半结构化特征的对象数据模型DOMSF,作为WI系统的统一数据模型。该模型是能适应WI系统要求的数据模型,具有丰富的数据类型和灵活性。DOMSF又是有演绎能力的对象模型,演绎规则的引入使之具有更强大的功能和表示能力,能描述除继承关系之外的更多对象之间的关系。 (3)对本体方法论的语义进行扩充,将其与DOMSF数据模型有机地结合在一起,并在此基础上提出本体模型表示语言ORL。该语言具有丰富的表达能力,并且支持语法和语义的可互操作性。 (4)基于对象的观点提出动态Web的层次访问模型,将页面看作是模板,以对象网络的观点来处理Web上的数据。在此基础之上提出源描述语言TDL,它结合文档结构和文本模式的描述,能很好地描述动态Web页面中的数据模式,能更好地适应页面的频繁变化。 (5)基于关系数据库提出一种基于本体模型的信息查询方法和优化算法。 (6)实现了一个WI系统的工具软件集-WISK(Web Integration Service Kits),并给出一个使用该软件集开发的实际应用的例子。 Web信息资源整合具有广阔的应用前景,在电子商务、智能信息检索、数字化图书馆、Web数据挖掘、企业信息门户等诸多应用领域都可大展鸿图。可以毫不夸张地说,信息资源整合将是新一代Web及电子化服务中的主导技术之一。