基于搜索引擎和语义的Web服务发现研究

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:ieksmc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web服务是一种基于互联网的开发和访问模型,允许用户使用服务提供商在网络上发布的服务,集成到自己的应用程序中。可以从根本上解决跨组织、跨企业的异构系统之间互操作和互通信的问题。随着越来越多的Web服务部署到互联网,如何发现合适的Web服务变得更为重要,传统的Web服务发现基于中心UDDI。这种方式为Web服务发布提供了不少方便,但是也存在着几个方面的问题,首先,UDDI注册库中可能没有包含实际存在的某个Web服务,其次,这种方式基于关键字匹配发现Web服务,这样发现的Web服务,查全率和查准率都会受到极大的影响。本文针对这两点问题,提出了一种基于搜索引擎和语义的方法。其目的在于建立一个Web服务发现领域的垂直搜索引擎,并将语义特性融入其中,这种Web服务发现方式能较好克服目前基于UDDI发现方式的弊端,提高Web服务发现的效率、查全率、查准率。本文所作的主要工作如下,(1)分析了国内外有关基于搜索引擎方式发现Web服务的研究现状和存在的问题,介绍了Web服务、Web服务核心协议、Web服务发现、搜索引擎、语义Web等相关技术。(2)实现了基于搜索引擎的Web服务发现方式。从互联网上抓取网页、解析网页内容、提取可能包含Web服务链接的网页并解析其中WSDL链接地址、抽取WSDL文档中具有代表性的元素,建立Web服务索引,以搜索引擎方式实现Web服务发现。(3)将语义特征融入搜索引擎。搜索引擎在本质上是基于关键字的,为了使搜索引擎具有语义特性,在研究Lucene内部的分析、索引和搜索机制的基础上,在用户搜索Web服务阶段应用查询扩展,以此提高服务发现查全率和查准率。(4)改进并实现一种查询扩展算法。首先提出了切词的概念,切词的目的在于将物理上的一个单词拆开成若干个逻辑上独立的词汇单元,本文实现了一种切词算法。查询扩展算法分成两个阶段,第一个阶段根据同义词扩展,将用户搜索关键字的所有同义词扩展到到查询中;第二个阶段是在此基础上,基于领域本体计算本体概念之间的语义相似度,根据量化的语义相似度进一步查询扩展,将满足一定条件的概念加入到查询之中。(5)提出一种基于搜索引擎和语义的Web服务发现模型(Web Service Discovery Model Based on Semantic and Search Engine, WSDMBSSE),它以互联网上的WSDL文档作为搜索空间,不再依赖任何一个UDDI注册中心,同时,语义方面的查询扩展使得WSDMBSSE能提供更好的查全率和查准率,而且,它也提供了较高的服务发现效率。本文详细介绍该模型的层次结构,以参与该模型的角色为出发点,阐述了模型的执行流程。基于该模型构建了基于搜索引擎和语义的Web服务发现门户原型系统(Web Service Discovery Portal Based on Semantic and Search Engine, WSDPBSSE),并选取了典型数据测试,对实验结果进行了相关分析。本文受到武汉市国际合作项目:“基于语义的可视化服务发布与匹配平台的研究与实现”(项目编号:200970634269)的资助。
其他文献
随着网络技术的日益发展,网络安全问题也变得日益严峻。异常行为检测作为一种积极主动的安全防护技术,在网络系统受到危害之前拦截和响应入侵,对网络主体进行纵深、多层次的
随着互联网的快速发展产生了海量数据,按照数据结构可以将这些数据划分为:高结构化数据、半结构化数据及以原始文本。其中结构化数据由于其具有完整的逻辑结构以及描述信息,
网络准入控制系统通过对于接入点的控制从而实现对整个网络的防护,准入控制技术层出不穷,其中以IEEE802.1x技术最为业界所认可。802.1x作为准入控制业界标准具有高度的灵活性
互联网提供了大量的广泛分布和高动态资源信息,网页信息分散且不方便管理。网页分类能有效解决这些问题。在网页分类过程中,选取特征是其中重要一环,传统的特征从网页正文、锚文
随着金融电子化程度的提高和计算机知识的普及,金融领域计算机犯罪问题越来越突出。而且有资料显示,过去发生的网络金融犯罪案件,绝大部分为内部人员所为,金融业务的安全性面
21世纪是知识经济时代,知识是企业的重要无形资产组成部分,是企业经营决策智慧的重要支撑,是提升员工工作效率和企业核心竞争力的重要因素,是企业永续发展必须重视的资源。鉴
针对当前日益严峻的环境形势,我国目前常规的环境监测手段已无法满足业务化流程的需求。出于国家安全考虑,我们需要提供自己独立专利权的生态产品生产分系统,使我们能够在任何时
随着高等教育的深化改革和招生规模的急剧扩大,我国高校普遍陷入了实验教学的困境。主要表现在硬件设施不足、教学方法和内容落后、教学受时空限制等方面。在计算机和多媒体
自然语言生成作为自然语言处理比较重要的一部分,正在被各大高校和研究机构等研究利用。随着深度学习和大数据的浪潮兴起,自然语言生成有了阶段性的突破,例如对话系统、新闻
随着网络技术的不断发展和革新,网络虚拟化已经成为计算机网络的发展趋势。当前的互联网已经严重骨化,从上层应用到底层硬件的刚性设计严重限制了新的技术和应用的部署和推广。