浅谈基于本体的问答查询系统

来源 :硅谷 | 被引量 : 0次 | 上传用户:davidjts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  中图分类号:TP2文献标识码:A文章编号:1671-7597(2009)1210115-01
  随着网络技术的发展,远程教育越来越受到人们的关注。答疑系统作为网络教育平台的一个重要组成部分,在老师和学生之间的交流方面发挥着重要的作用。传统的答疑系统比较集中在答疑方式和答疑系统的实时交互方面,对其中的关键部分-语义的理解,涉及的不是很多。
  针对上面的问题,本文提出用领域本体作为语义理解的基础。本体(ontology)是一种用来描述概念以及概念和概念之间关系的模型,领域本体是本体的一种,它包含该领域的比较完整的知识和丰富的语义关系,把这些资源通过一种方法应用到问答查询系统中,使得一定程度上解决目前答疑系统中语义的理解不足的问题成为可能。
  在问答查找系统中,针对特定领域的答疑,需要建立相应的领域本体。领域本体一般是由该领域的专家来建立。领域本体定义了该领域的一组术语,这些术语称之为概念。概念和概念之间的关系描述了该领域的概念结构。
  目前已有的领域本体很多,出于对各自问题域和具体工程的考虑,构造领域本体的过程也是各不相同的。由于没有一个标准的构造方法,不少研究人员从实践出发,提出了不少有益于构造本体的标准,其中最有影响的是Gruber于1995年在文献中提出的5条规则:
  1.明确性和客观性:本体应该用自然语言对术语给出明确、客观的语义定义。2.完全性:所给出的定义是完整的,完全能表达所描述的术语的含义。3.一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾。4.最大单调可扩展性:向本体中添加通用或专用的术语时,不需要修改已有的内容。5.最小承诺:对待建模对象给出尽可能少的约束。
  当前对构造本体的方法和性能评估还没有一个统一的标准,这是一个需要进一步研究的方向。目前对于特定的应用,本体的构造方法不完全相同。但在构造特定领域本体的过程中,有一点是得到大家公认的,那就是需要该领域专家的参与。下面,针对我们的答疑应用,采用语义网络的描述方法来构造领域本体。
  领域本体的开发和完善是一个反反复复不断补充的过程。领域本体中的概念应该贴近于要研究的专业领域中的客观实体和关系法则。它的构造要经过五个步骤:
  1.确定领域本体的专业领域和范畴。可以通过确定专业领域和范畴作为开发领域本体的起点。首先,要明确构建的领域本体将覆盖的专业领域、应用本体的目的、本体应该在哪些方面发挥作用以及它的系统维护者与应用对象。
  2.复用现有的本体。如果系统需要和其它的应用平台进行互操作,而这个应用平台又与特定的领域本体或相关概念联系在一起,那么复用现有的本体是行之有效的方法。许多现成的本体,例如前面提到的Ontolingua的
  本体文库、DAML的本体文库UNSPSC、和DMOZ等,可以导入到本体开发系统中,本体的格式转换也并不困难。
  3.列出本体涉及领域中的重要术语以及术语的属性与属性值。领域本体是描述概念以及概念与概念之间的关系,首先要列举出该领域中的所有概念以及对该概念的详细解释,在特定领域,这些概念就是有关的专业术语。除此之外,针对每个概念,要列出它所有可能的属性,每个属性都有对应的属性值。
  4.定义关联结点。为了对概念和概念之间的关联关系进行详细的说明,需要对概念定义关联结点。例如,为了说明概念“内模式”和“外模式”的区别,在概念“内模式”下存在一个关联结点:区别,该结点关联另外一个概念“内模式”。并需要对该关联结点详细说明。
  5.定义概念之间的各种关系。在领域本体中,概念和概念之间通过关系来交互。在知网中,一共描述了概念之间的8种关系;上下位关系、同义关系、反义关系、对义关系、属性-宿主关系、整体部分关系、材料-成品关系、事件-角色关系。
  知网可以看成是一个庞大的通用本体,构建这样的本体是件非常费时费力的事情。针对特定领域答疑系统的特点,在我们构建的领域本体中使用了四种关系:继承关系、部分关系、相关关系和同义关系,其中的继承关系可以看成是知网中的上下位关系。
  1.继承关系(is_a)。继承表示概念之间的包含和被包含关系,也可以看成是概念之间的泛化和特化关系。如果概念Ci是Cj的一种特殊概念,那么我们说概念Ci是概念Cj的特化,概念Cj是概念Ci的泛化,概念Ci继承于概念Cj。概念都有它自己的属性。如果两个概念间存在继承关系,那么继承的概念将拥有被继承概念的所有属性。例如,概念Cj继承于概念Ci。那么概念Cj将拥有概念Ci的所有属性,另外还可能有它区别于概念Cj的特殊属性。
  如果概念Cj同时继承于Ci和Ck。这是一种多重继承(与面向对象的概念非常相似)。
  2.整体部分关系(part of)。概念和概念之间存在着整体部分关系。如果概念Cj是概念Ci的一个组成部分,那么我们说概念Ci和概念Cj之间存在整体部分关系。在数据库领域中,概念“前像”、“后像”都是概念“运行记录”的组成部分,所以“运行记录”和“前像”、“后像”之间是整体部分关系。
  3.相关关系(relevant of)。相关关系表明概念和概念由于某个主题而相互关联。概念 “前像”和“后像”由于都是“运行记录”的一部分而存在一种相关关系。相关关系可由继承关系和部分关系中导出, 所以图中可以不画出来。
  4.同义关系(synonymy of)。在一个领域中,一个概念可能有几种不同的表示方式,也就是可以用不同的词语来表示一个相同的概念。例如:“数据库管理系统”和“DBMS”、“聚集”和“簇集”都是同一概念的两种不同的说法,所以这两个概念之间存在同义关系。在图中,同义关系用一根不带箭头的实线相连,继承关系和部分关系是两种最主要的关系,相关关系可以从继承关系和部分关系中体现出来。出现同义关系的概念不是很多。
  应用上面的四种关系,我们可以把领域中的概念构建成一个具有等级的网络结构。构建的过程是一个概念不断细化或泛化的过程。下面介绍构建等级网络结构的方法。建立一个等级网络体系有3种可行的方法。
  自顶向下法:由某一领域中最大的概念开始,通过逐层的添加子概念将这些概念细化。最终得到本体的等级网络结构。
  自底向上法:由最底层、最细小的概念定义开始,将这些细化的概念一层一层的组织在更加综合的概念之下,形成一个等级网络结构。
  综合法:首先定义很多非常显而易见的概念,然后分别将它们向上层进行恰当地归纳和向下层进行细化,构成一个等级网络结构。
  至于具体在实践中采取什么方法构建等级网络结构, 主要取决于于开发人员对专业领域的个人观点。由于综合法是从一些最普通的概念入手,比较符合人的习惯,所以综合法对本体开发者而言最便捷。
  
  参考文献:
  [1]Ontology Development 101:A Guide to Creating Your First Ontology.http://protege.standford.edu/publications/ontology_development/ontology101noy-mcguinness.htm.
其他文献
中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)1210100-01    一、引言    经常有人觉得VB在处理打印报表的问题时比较麻烦,其实Microsoft Visual Basic 6.0专业版和企业版中的数据报表设计器(Data Report Designer)就可以比较方便地实现常用报表打印。    二、设计思路    用户指定部门和日期范围后,程序从SQL数据
随着成都市公交职业中学首届艺术节文艺演出的结束,学校首届艺术节也圆满落幕。成都公交职中首届艺术节3月开始举行,在为期近两个月的时间里,先后举行了书法、绘画、广播操、
[摘要]论述无线载波以太网络的主要技术要求,这为如何提高该网络的服务质量具有明确的指导意义。  [关键词]无线载波以太网回程宽带聚合吞吐量超静定性相应时间  中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)1210110-01  伴随着移动运营商对高速下联数据包访问技术的日益关注,载波以太网已经获得了广泛的支持。由于可测量性、可靠性、服务质量、服务管理等诸多属性的实现,载波
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
病历摘要患者男,62岁,因左上腹包块50余年,左上腹疼痛10天,于1985年5月18日入院。患者7岁时不规则发热3~4月,伴左上腹包块进行性增大,超过脐及正中线。未经诊治发热自行缓解,
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
[摘要]设计一个应用系统似乎并不难,但是要想使系统达到最优化的性能并不是一件容易的事。在开发工具、数据库设计、应用程序的结构、查询设计、接口选择等方面有多种选择,这取决于特定的应用需求以及开发队伍的技能。以SQL Server为例,从后台数据库的角度讨论应用程序性能优化技巧,并且给出一些有益的建议。  [关键词]SQL Server数据库优化高效索引  中图分类号:TP3文献标识码:A文章编号:1
学校名称:天津滨海职业学院办学地址:天津市塘沽区福建北路350号联系电话:022-66315884、66307150(传真)E-mail:zsb@tjbpi.com.cn 报考条件:普通高中毕业生或具有同等学力者
[摘要]实验室信息所涉及的信息内容比较广泛,包括实验室的基本信息、实验室教学的基本信息、实验队伍的基本信息等方面的内容,这些内容是实验技术人员、管理人员从事实验教学、实验研究和实验管理所留下来的历史记录和经验总结,它是进行实验室科学管理、决策的依据;是进行实验教学改革中和教学研究的必要条件;是教学质量评估的重要依据。因此,实验室信息管理成了实验室管理的一个重要组成部分,其管理质量的好坏将直接影响到
患儿男,11岁。因便秘近5个月,尿失禁20天于1986年3月29日入院。患儿在1985年11月起无诱因出现便秘、排便每日1次至数日1次,排便困难。1986年2月出现尿频、尿急。3月11日出现