基于中文文本的本体构建方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:suan11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web的存在、研究、和运作的基础是形式化本体。本体是对可共享概念的一个形式化的明确说明,它包含对某个领域的概念及概念间的关系的描述和约束。自20世纪90年代提出这个概念以来,本体受到了国内外越来越多的关注,但本体研究实际上还处于初步阶段,其理论和方法都有待于进一步完善。特别是现阶段的本体构建需要耗费大量的人力、物力和财力,时间周期也很长。因此,本体的有效构建成为本体研究乃至语义Web研究的瓶颈。探讨构建领域本体的有效途径,成为了一个无法回避的问题。本文围绕中文本体的构建方法进行了讨论和研究。首先对本体和本体学习基础知识进行了简单的介绍,给出了当今国内外本体构建的主要方法以及评价标准,介绍了目前比较流行的几种本体学习工具。其次,针对传统本体资源构建方式的不足,本文提出了基于统计和规则混合策略的本体获取方法,描述了整个方法的框架和两个关键子模块框架,并对此方法进行了合理性分析。然后讨论了在这个框架下的几个关键技术问题:语料获取与预处理,术语抽取,关系抽取,并分别对这些问题的解决方案作了详细介绍。再次,本文提出了基于决策树的本体自动扩充方法,将本体自动扩充的主要任务定位在实例的概念分类上,从已有的本体库中获取实例作为训练样本构建规则的决策树,这组规则可以用于指导丰富本体知识。最后,对本文提出的本体获取方法进行了初步的试验,对试验结果进行了分析,评价了这种方法的优缺点。
其他文献
特征选择是统计模式识别、机器学习和数据挖掘等领域的一个关键问题,是从一组特征中挑选出一些最有效的特征以降低特征空间维数的过程。特征选择不仅能够降低特征维数,同时还
网络多媒体信息的安全传输越来越受到人们的关注,特别是在个人隐私、商业数据、政治军事等敏感性较高的场合,多媒体数据传输的安全性要求更高。多媒体流传输标准技术主要有基
随着Internet的迅速发展和普及,越来越多的政府、商业、金融等企事业单位和科研机构将自己的信息以及数据库系统连接到Internet上,实现信息资源的网络共享。为了获取有用的信
在远程教育体系中,虚拟实验室是一个重要的组成部分。虚拟实验室是采用虚拟现实、计算机仿真、多媒体技术等手段,结合网络环境形成的一套虚拟实验系统。其中,虚拟实验室的整
随着P2P技术的推广和流行,P2P网络中的安全和隐私问题也日益凸显,其中P2P网络中的恶意节点对用户使用以及整个P2P网络的正常运行都带来了极大影响。近年来,基于P2P的匿名通信
人工鱼群算法具有良好的克服局部极值、取得全局极值的能力,比较容易找到满意解的域,但是该算法很难得到精确的最优解,而且算法在收敛性、计算复杂度等方面还有很大的缺陷。本文系统地论述了人工鱼群算法的基本理论,并针对人工鱼群算法的不足,提出了改进策略。论文重点研究了适合配电网网架优化规划和配电网开关优化规划的人工鱼群算法的改进方案和策略,并且给出了改进人工鱼群算法在配电网网架优化规划和开关优化规划应用的实
化工厂的某些管道由于长期暴露在外,风吹日晒,因材料老化或毒气腐蚀的影响,出现磨损、腐蚀,如不及时修复更换,则会造成气体泄露,甚至造成大面积有害气体扩散,最终导致严重事