论文部分内容阅读
随着互联网技术的迅猛发展,社会对于软件技术的创新提出了更高的要求,软件技术正在走向网络化发展的时代。
网络化软件是一种特殊的面向服务计算的超大型复杂软件系统。面向网络化软件的需求工程因其动态拓扑结构、用户的不确定性及个性化、多样化的动态需求而面临很多的问题。目前软件需求工程中的建模理论方法对面向服务计算的网络化软件的开发缺乏足够的支持,以用户为中心、导向以及提高用户的体验质量正成为网络化软件开发的核心目标。
RGPS是武汉大学软件工程重点实验室973项目组提出的面向网络化软件的统一的需求元描述框架。RGPS需求元模型框架是服务于网络环境中涉众(面向同一问题的大众用户和开发人员的利益相关方)的一种需求元描述方法,涵盖了网络化软件需求描述中所需的角色Role、目标Goal、过程Process和服务Service四个基本要素,由角色元模型、目标元模型、过程元模型和服务元模型及其之间的相互关联关系组成,RGPS已经成为贯穿网络化软件工程的方法论。
同时,搜索已经成为互联网发展的核心引擎。论文聚焦于如何将基于搜索引擎的主题爬虫技术在统一需求元模型RGPS的指导下应用于实际载体。通过对Web结构、Web搜索策略、Web网页解析及Web信息抽取等技术的研究完成一个针对某固定主题数据抽取的网络爬虫实例。
最后,论文将阐述如何利用主题爬虫技术解决面向城市交通领域的Web服务的发现及获取问题,利用RGPS元描述框架对Web服务的功能描述进行扩展,实现基于RGPS的领域Web服务搜索。Web服务的发现、描述、获取及搜索事实上构成了按需回答平台的核心部分。
本文的主要贡献和创新如下:
(1)RGPS元模型框架的研究及其应用于Web服务描述
(2)基于搜索引擎的主题爬虫相关技术的研究
(3)面向领域Web服务的主题爬虫系统的设计
(4)应用RGPS元描述框架实现Web服务的按需搜索
上述工作为网络化软件时代的统一需求元建模框架RGPS在Web服务的发现、描述、获取、查询等问题上的应用给出了具体的解决方法。