基于索引的web服务发现研究

来源 :北京邮电大学 | 被引量 : 13次 | 上传用户:zhangkun289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
web服务作为SOA有效的实现技术已经取得了很大的发展。与传统网页相比,web服务领域存在更加严重的信息孤岛问题。在Internet上,特定功能的web服务不仅淹没在web服务库中,同时也淹没在普通网页库中。因此,对web服务进行快速、准确的查找成为web服务领域亟待解决的问题,从而促生了人们对web服务发现领域的研究。本文结合国家973计划“一体化可信网络与普适服务体系基础研究——普适服务的基础理论、模型与关键技术”项目,以面向服务的架构(Service Oriented Architecture, SOA)为基础,对web服务发现领域中的问题进行了研究,并取得了一定的成果。论文中的工作主要集中在以下几个方面:1.选择一个恰当的形式化模型是web服务发现的基础。目前的web服务的形式化模型相对于原始的web服务描述文件,存在信息丢失或者信息强加现象。信息丢失主要表现在对web服务进行形式化时丢失了web服务描述文件中的大量有用信息,这种现象多出现在传统的基于关键词匹配的web服务发现方法中,这导致了在后续的web服务匹配中缺少依据,难以支持高准确性的查找;信息强加主要表现在形式化模型中包含了web基本服务描述文件中不存在、且难以获取或无从获取的信息,多出现在基于语义本体的web服务发现方法中,这导致后续的web服务匹配所依赖的信息在许多web服务中不存在,从而导致这类方法在Internet上推广困难。本文设计了一种web服务形式化模型。该模型基于web服务(组合)基本的描述文件,如wsdl文件、bpel文件等。较传统的基于关键词的web服务形式化模型,可以包含更丰富的语义信息;较基于语义本体的web服务形式化模型,其所有信息都可以由web服务(组合)的基本描述文件中获取。从而使得此形式化模型所支持的web服务发现系统能够更好的处理Internet上的web服务,从而具备更强的可推广性。2.作为web服务发现的核心组件——web服务匹配,其准确性极大的影响着web服务发现的准确性。目前能够提供高准确性匹配的web服务匹配引擎绝大部分都依赖于本体库,借助于本体对象完善的描述信息实现更加准确的匹配。然而,目前并没有出现权威的本体库,web服务发现系统的本体库多是由服务发现系统创建者自己创立的,不同创建者创建的本体库难于一致、或兼容,这使得匹配失去了公认的基准,直接导致了理论上的完美与实践中难于的实现的矛盾。本文提出了一种能够支持高准确性匹配并不依赖于本体库的web服务匹配引擎。在自然语言描述匹配中设置了同义词扩展、本体库扩展接口(可选),本体库扩展接口是否引入不会对自然语言匹配引擎的准确性起到很大影响;web服务多数有效信息包含在在由多语义片段组成的多词拼接体命名中,处理由多语义片段组成的拼接体命名时,在并发使用概率的监督下,依次对命名体进行了同义词扩展、缩写词扩展、本体概念关系扩展(可选)、命名语义体归纳,在针对自然语言匹配引擎难于处理的多词拼接体命名的匹配中,取得了很高的准确率。整个匹配引擎表现出了高查准率和查全率,同时脱离了对本体的依赖。3. Internet上的web服务性能差别很大。有的web服务描述信息与所提供的实体严重不符;有的web服务虽然服务描述与所提供的实体能够一致,但使用时响应时间太长,或者有的使用界面很不友好,使用起来很不方便。而这些web服务所提供的描述信息差别不大,如果仅仅基于这些描述信息的匹配结果进行服务查找,难以辨别这些性能不同的服务。本文提出了一种基于用户体验的web服务性能评估方法。借助于目前普通web网页的评估工具和理论,结合web服务本身的特点,我们提出了一种高可行性、低开销的web服务性能评估方法。通过对web服务信息与功能方面的评估来实现对web服务的整体性能评估。我们将该方法作为一个组件加入到web服务发现系统中,显著提高了web服务发现系统的查准率。4查询准确性与查询请求处理时间是web服务发现系统最重要的两个衡量标准。目前的研究成果中存在低请求处理时间与高查询效率不可兼得的问题。低请求处理时间多出现在基于传统关键词匹配和索引架构的web服务发现系统中,它们能够保证低请求处理时间但查询准确性却难于保证;由于传统的关键词匹配在处理多词拼接体命名时准确性很低,从而导致了完成同一功能、被表达成不同形式的web服务查找不到,或查找到的结果中包含许多与用户需求不相关的web服务。高查询准确性多出现在基于语义本体的web服务发现系统中,这些方法通过引入语义本体来完善web服务描述,通过明确描述目标的各个属性达到精确匹配的目标;然而他们引入语义本体描述的同时也引入了本体推理机制,这些推理机制多基于自动机,需要进行服务间两两匹配;关键词被扩展成本体类,每个类的匹配需要进行多个属性的匹配,从而在完善关键词描述的同时也增大了关键词匹配的规模;这些使得基于语义本体的web服务发现系统在进行服务查找时的时间复杂度扩展到O(n2)(其中n为服务库中的属性总数)规模,当web服务库规模增大时,进行web服务发现的请求处理时间急速增大。本文提出了一种基于索引库的web服务发现架构。此架构基于索引库,有效的降低了服务发现时的查找空间,从而使得服务发现的处理时间可以控制在合理的范围内;在建立索引库的过程中,引入了语义挖掘,很大程度上克服了传统的不依赖本体库的索引架构查准率低的缺点;架构中引入了对web服务潜在组合方案的查找,进一步提高了查全率;增加了web服务性能评估组件用以优化匹配结果,提高了web服务发现的查准率。整个架构在实验评估时表现出了很高的查全率和查准率。解决了低请求处理时间与高查询效率不可兼得问题。
其他文献
随着我国经济的迅速发展,人们的用电量也在不断的增高,电表的数量也随之增多,在这样的情况下,传统的抄表方式已经不适合目前的电表数量和用电方式了,为了提高抄表的效率,减少
结合某简支箱梁施工实例,详细地探讨了简支箱梁施工中的支架预压及模板调整、钢筋及钢绞线加工与安装、混凝土浇筑、预应力施工及真空注浆等施工环节,总结了切实可行的施工技
结合具体工程实例,对曲线连续刚构桥进行结构分析。结果表明:“弯-扭”耦合现象使得曲线连续刚构桥的受力性能与直线桥有明显差异。对小半径、大跨径的曲线刚构桥,有必要对其进
李忠信同志认真履行总会计师职责权限,注重财会制度和队伍建设,充分发挥财务部门的综台职能作用,坚持企业理财以资金为中心的方针,适时提出了“紧控严管,精打细算”和“八不准,九从
在越来越多的设计和越来越多的市场中,我们都能看到FPGA的身影。随着它们被纳入越来越多的系统中,它们本身也在变得越来越复杂。十年之前,FPGA的主要市场是工业、医疗、汽车
目的:1.通过动物体内植埋实验及体外细胞毒性试验评估聚氨酯(PU)材料宫内装置(自主专利产品)的生物相容性。2.通过测量PU材料宫内装置的各项物理机械性能,评估其是否满足宫内
近日,部西部交通建设科技项目管理中心在云南省昆明市组织召开了由交通运输部科学研究院、云南省航务管理局、武汉理工大学共同承担的西部交通建设科技项目“澜沧江航运发展及
FFA市场自1992年在英国伦敦创立以来在交易品种、交易量和交易者等市场规模方面不断扩大,重要的是在套期保值、信息传递和结算机制等方面自2008年金融危机以后获得了极大改善
为探明天然次生林和人工油茶林土壤节肢动物多样性特征及其变化规律,基于Tullgren干漏斗法和罐诱法对八大公山亮叶水青冈林、枫香林、光皮桦林、栲树林和耒阳市南京乡半垦复
6月15日,交通运输部举行第五批交通运输行业节能减排示范项目授牌暨全国道路客运节能减排达标竞赛启动仪式。至此,交通运输行业节能减排示范项目总计已达1∞个,形成了一个覆盖公