一个基于本体的Web服务查询弱化算法

来源 :中国信息导报 | 被引量 : 0次 | 上传用户:kuibugo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]传统的基于UDDI的Web服务查询算法对于服务提供者与服务发现者之间术语不一致的问题无能为力,为了解决这个问题,本体被引入Web 服务之中,目前已经有一些新的Web服务查询算法把本体考虑进来,但是这些算法虽然提高了查全率,却在一定程度上降低了查准率。本文主要从提高查准率和用户满意度的角度,讨论了一个基于查询弱化技术的Web服务查询算法,并把该算法和另外一个算法作了简单的比较分析,然后用一个实例验证了算法的有效性。
  [关键词]本体;Web服务;语义弱化;服务发现
  
  1 引 言
  
  传统的基于UDDI的Web服务发现机制是基于关键词的检索技术,检索的主要依据是Web服务的名称,如果服务请求者和服务发现者使用的术语不一致,使用基于关键词的检索技术无法发现满足条件的所有Web服务。
  已经有研究者提出在Web服务中引入领域本体来解决这个问题,在文[1]中,作者通过结合一个具体的试验项目METEOR-S,探讨了如何构造一个基于本体的Web服务具有良好扩展性以及系统的构架,同时在文中指出通过匹配IOPE(input,output,precondi-tion,effect)来进行Web服务发现,但是并未给出其算法细节。
  文[2]、[3]讨论了基于本体的Web服务匹配算法,其主要思想是通过Web服务的IO(input,output)参数类型和本体关联,通过匹配web服务的输入输出参数类型来决定某一个Web服务是否是所要查找的Web服务,分别提出了计算匹配度的方法,可以把匹配度作为查询结果排序的依据。该算法的问题是当Web服务的IOPE是查询条件的上位类时,就认为匹配,这样降低了查准率。
  文[4]、[5]从用户满意度的角度指出精确匹配是多余的,应允许非精确匹配的存在。文[4]更是通过一个语义Web服务的用例,指出在大多数情况下只需要匹配OE(output,effect)。文[5]中提出把Web服务参数依据客户的要求是强制性还是非强制性,分为软性条件(soft condition)和硬性条件(hard condition),应该对这两类条件采取不同的匹配策略。
  本文在这些研究的基础上,从提高查准率和用户满意度的角度出发,提出了一个基于本体的Web服务查询弱化算法。
  
  2 基于语义的Web服务查询弱化算法
  
  2.1 算法思想
  该算法思想是用迭代式的强制匹配来获得较高的查准率。每一次迭代过程后对于软性条件(soft condi-tion)弱化一次,所谓弱化就是用查询条件的上位概念来替代它,由于查询条件不断被弱化,Web服务被发现的可能就越来越大,这一迭代查询过程直到某一个条件被满足为止(例如,检索出的结果集包含了~定数量的Web服务,或者弱化到了一定的距离就自动返回)。算法的输入是Web服务的输入输出参数fIs(input soft),In(input hard),Os(output soft),Oh(output hard),记为集合C,对应领域本体中相应的概念。把UDDI中的每一个注册服务与集合C进行hard match,假设得到的结果集为R,如果R包含了大于阈值的Web服务,那么算法返回,否则对查询条件C进行弱化,得到查询条件C1,再用C1和每一个注册服务进行Hard match,如此往复。通过对阈值的设定,可以对Web服务的查全率和查准率都做到较好的控制。
   
  2.2 算法描述
  为了方便描述算法,先引用文[3]中的定义:
  定义1 Web服务可以描述为:
  WSi(Ii,Oi)
  Ii是输入参数类型(与本体对应),Oi;是输出参数类型。
  定义2 WSi和WSj精确匹配表示如下:
  Exact(WSi,Wsi)={Iiequivalentclassof Ii l and Oiequivalentclassof Oi}
  基于查询弱化的查询算法如下:
  (1)设定初始弱化次数Relaxcount为Oi,查询结果集WSResult为空。
  (2)把查询条件{Input condition,output conditionl与UDDI中的每一个注册Web服务的输入输出参数进行匹配,如果是精确匹配,就是定义2所指的Exact匹配,就把这一个注册Web服务加到查询结果集中。
  (3)如果查询结果集WSResult包含的Web服务数量超过了一个阈值,或者查询条件fInput condition,output condition}弱化的次数(也就是Relaxcount的大小)大于某一个阈值,抑或查询条件{Input condition,output condition}中的参数都已经弱化到了对应的本体中的根节点,那么算法结束,否则转到(4)。
  (4)记查询条件中的软条件{soft input condition,soft output condition}为R,计算R中的每个参数在本体中的深度(也就是其到本体根的距离),找出深度最大的参数,如果这样的参数只有一个,那么把该参数替换为其本体中的父节点,Relaxcount=Relaxcount+1,执行转到(2),否则转到(5)。
  (5)计算具有最大深度的参数对应的概念在本体中的父节点的出度,找出那些具有最大父节点出度的参数,如果只有一个参数的父节点具有最大出度,那么把该参数替换为其本体中的父节点,Relaxcount=Re-laxcount+l,执行转到(2),否则转到(6)。
  (6)找出具有最大深度的参数中最左边的一个,那么把其替换为其本体中的父节点,Relaxcount=Relax-count+1,执行转到(2)。
  在上面的描述中,(4)到(6)是查询条件弱化的过程。对于查询条件的弱化是算法的关键,弱化策略(也即哪些参数应该优先弱化)的好坏直接决定了下一轮匹配的结果,进而决定了查全率和查准率。在本体中,根到节点的距离越大,往往表示某一个节点所代表的概念越专指。如果两个节点到根的距离是一样的,那么父节点出度大的概念的专指度大。如果其父节点的出度也相同,那么认为这两个节点的专指度是一样的。进行查询条件弱化时,我们总是先把最专指的条件进行弱化,也就是往树根的方向走,这样的弱化顺序带来的语义损失最小,因而可以带来最好的查全率和查准率的平衡。
  


  假设有图l所示的本体,包含3个本体Hotel、Lo-cation、Food,假设有一个用户需要来到某一个城市,需要使用该市的宾馆预定服务,输入的有餐饮类型以及宾馆的位置,输出是宾馆名称。假设用户想要预定市中心某个位置附近能提供中国菜的某一宾馆,那么查询Web服务时就转换为接受参数类型fcenter,chinese-food},以此作为Web服务查找的条件。假设该市的预定服务可能有以下几个:
  {Bookl{location,Food),Book2{City,Chinesefood},Book3{city food}}
  假设所有的条件都是soft condition。下列表格演示了算法的执行过程:
  


  
  结 论
  
  由上可见,该算法能够完成设计目标,即完成基于语义的匹配,而且算法产生的结果是按语义损失由小到大排序的,因而总是最前面的结果满足用户的查询需求。该算法和文[2]中提出的算法相比较,其执行效率要低一些,因为可能要进行反复查询,但是提供了更高的准确度,因为算法执行的过程是从最符合查询要求的结果开始过渡到不那么符合条件的检索结果,也就是说该算法提供了web服务的排序机制,同时还可以通过控制阈值对算法的执行次数以及结果集大小进行控制。该算法还有改进的余地,通过一定的手段,可以减少查询弱化的次数,例如每次向上弱化条件时,可以弱化两层,或同时弱化两个节点,另外弱化的顺序还有进一步改进的余地,特别是一个已经弱化过的节点,如果和一个没有弱化过的节点的深度一样的话,那么它应该在没有弱化过的节点之后弱化,这样带来的语义损失要小一些,可以提供更高的查询精度。
其他文献
[摘要]数字资源整合是为解决当今海量的分散无序数字资源而提出的。本文在分析现有资源整合方式的基础上;提出采用基于语义的方式来进行资源整合,并对基于语义的整合模式进行了研究,重点讨论了该方式中最重要的一个步骤——本体映射。  [关键词]语义;本体映射;资源整合    随着计算机及网络技术的迅猛发展,因特网上的信息已经成为一个巨大的信息库,同时各企事业单位也开发了大量软硬件平台各异的数据库系统。这样就
期刊
[摘要]本文介绍了数字参考咨询在标准规范方面的意义,并结合相关资料提出了一些建设性意见和应注意的问题。  [关键词]数字参考咨询;规范化;元数据;协议;知识库    数字参考咨询作为基于网络环境提供数字信息资源导航和参考服务的系统机制,既是数字图书馆的重要组成部分,也是信息社会中网络化信息服务的重要内容。随着数字信息资源的迅速发展和网络化信息服务的不断丰富,任何孤立、封闭的数字图书馆系统或者数字信
期刊
[摘要]现代数字图书馆对存储系统有高可靠性、高可用性以及高性能(I/O率和数传率)、动态可扩展性、易维护性和开放性等方面的要求,而目前使用的存储系统还远不能满足这些要求,对现有的存储技术提出了挑战。本文通过介绍数字网格的概念及GridFTP存储技术在数字图书馆中的应用,对现代数字图书馆数据存储提供了新的解决方案。  [关键词]数字图书馆;网格;GridFTP;数据存储    宏观上讲,网格是信息社
期刊
新闻素描    中国政府高度重视自主创新能力建设  3月27日,在全球知识产权保护与创新论坛上,国务院副总理吴仪致信祝贺,国务委员陈至立出席开幕式并发表了主旨演讲。  吴仪在贺信中说,中国政府高度重视自主创新能力建设,确立了建设创新型国家的发展战略,并不断完善知识产权制度,加大保护知识产权力度。中国政府将继续采取更加有效的措施,并愿意同国际社会加强合作,相互学习,坚持不懈地推动知识产权保护工作。 
期刊
[摘 要]本文阐述了要增强科技自主创新能力,就应高度重视以科学发展观为指导,走中国特色的科技创新道路,并对我国自主创新的战略选择提出了建议。  [关键词]科学发展观;自主创新;战略    当今世界,科学技术已成为经济社会发展的决定性力量,科技自主创新能力正成为国家竞争力的核心。我国已经明确提出,要把科技进步和创新作为经济社会发展的首要推动力量,把提高自主创新能力作为调整经济结构、转变增长方式、提高
期刊
[摘 要]本文采用统计学与文献计量学方法,对1995-2006年香港地区SCI论文的成长情况、学科分布、论文质量,以及院校、科研机构合作情况进行分析,探讨香港SCI论文的特点,揭示香港与大陆科技合作中的潜在问题。  [关键词]SCI;文献计量;香港    从历史上看,1997年以前港英政府奉行“积极不干预政策”,坚信市场机制的力量,主张香港经济和科技发展完全由市场来决定,而政府则尽量避免采取任何统
期刊
[摘 要]网络教育资源共享是目前网络教育资源建设亟待解决的问题,OAI协议是一个基于HTTP协议、与应用无关的、易于实现的低成本元数据共享和互操作协议,将OAI协议用于网络教育资源的共享是当前条件下一个较好的选择。本文对OAI协议进行了介绍,并分析了OAI协议应用于网络教育资源共享的优势。  [关键词]网络教育资源共享;OAI;OAI-PMH;元数据    从1999年教育部批准4所高校开展现代远
期刊
[摘 要]网络隐私权是指公民在网上享有私人生活安宁和私人信患依法受到保护,不被他人非法侵犯、知悉、搜集、复制、利用和公开的一种人格权,也指禁止在网上泄漏某些与个人相关的敏感信患,包括事实、图像以及诽谤的意见等。本文由“Google Earth”事件说起,对网络隐私权的特点进行了探讨,认为网络隐私权的客体范围较传统隐私权有所扩大。  [关键词]隐私;隐私权;网络隐私权Google Earth    
期刊
2007年5月25日,中国北京国际科技产业博览会组委会办公室主办的第十届科博会“自主创新与高新企业发展国际论坛”在人民大会堂举行。大会主题是“合作创新,共赢发展”。全国人大常委会副委员长蒋正华及相关部委的领导先后做了精彩的演讲。他们从政府的角度,从国家创新体系的建设,就自主创新以及促进高新企业发展进行了深层次的分析,提出了很多重要的意见和进一步发展的思路,对提升企业的自主创新能力、帮助企业与国际接
期刊
[摘 要]本文阐述了高校图书馆实施ISO9000质量管理体系的必要性以及ISO9000标准在管理理念、资源配置、过程控制和改进等方面对提高图书馆管理水平与服务质量的促进作用。  [关键词]图书馆;ISO9000标准;质量管理;信息服务;竞争力    1 高校图书馆实行ISO9000质量管理体系的必要性    1.1 信息技术的发展和读者需求的变化对图书馆信息服务提出了新的要求  随着社会信息化程度
期刊