论文部分内容阅读
为了更好地利用Web信息,语义Web逐渐发展起来,并日益引起人们的重视。本体是语义Web的基础,手工构建本体费时耗力,本体学习被认为是解决这一瓶颈的有效方法。在本体学习中语义关系学习是一个难点。
本文对关系学习的方法进行研究,提出关系学习算法SBRL。该算法基于句法模式,采用近似匹配的思想。本文采用术语词典作为关系学习的数据源。实验结果表明本文的算法可以有效地从术语词典中抽取各类语义关系。由于术语词典中的术语存在稀疏性问题,同时为了将算法扩展到可以从自由文本中抽取语义关系,本文还对术语发现进行了研究,提出了术语发现算法TBTA,实验结果显示该算法可以有效地从本文中发现术语。
本文在关系学习方法研究的基础上,实现了一个基于术语词典的关系学习系统RLD。RLD的主要任务是从XML格式的术语词典中发现并抽取语义关系。这是一个有监督的过程,主要包括术语的标注、关系的手工标注、关系的学习和结果的评估四个部分。实验结果表明RLD可以有效地从术语词典中抽取同义、下位等多种语义关系。