基于SVM算法的本体实例分类改进研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:xinlingsvs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术和Internet的不断的发展,不仅带来了总量上的“信息过载”问题,而且还有结构性的“信息短缺”以及各种“信息陷阱”、“信息迷雾”等问题,使得获取特定信息的难度不断加大,因此,有学者提出知识工程的思想来专门研究如何有效地对知识进行处理。知识工程主要包括知识表示、知识获取以及知识管理三个基本课题,其中知识表示是知识工程的核心。研究发现,本体能够很好的表示领域知识,并且能够提供计算机能够理解的形式化语义信息,促进计算机之间的通信和互操作,让计算机模拟人脑的功能准确地、自动地对信息进行处理。本体自动扩充是当前本体研究的热点问题,所谓本体自动扩充是指自动地对语料进行处理,从中抽取出本体概念实例,在实例与本体概念之间建立关系,最终建立起本体种群。本体自动扩充研究中最关键的部分是本体实例的分类,即通过特定的分类算法计算实例与概念之间的相似度,一方面把识别出的本体实例填充到相应的本体概念当中去,另一方面尽可能多的识别出本体概念的实例,提高本体实例分类的准确率和召回率。目前,本体实例分类的研究主要通过借鉴人工智能、机器学习等领域的研究方法进行研究,所应用到的方法主要有两类,一类是基于规则的方法,这种方法通过构建实例识别、分类的规则来实现本体的自动扩充。另一种基于统计的方法,通过标注语料训练或自学习的方式建立统计模型,进而利用该模型抽取本体概念实例实现本体自动扩充。作为在人工智能、机器学习等领域的研究中广泛应用的算法之一——支持向量机算法,能够被用来解决本体实例的分类问题。支持向量机(SVM)是一种向量空间模型(VSM),它把对文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,通过计算向量之间的相似性实现实例的分类。本文提出了一种SVM算法的改进模型即Onto‐Bt‐SVM模型,它主要是针对SVM算法难以解决多类分类问题以及特征向量构造难度大两方面的问题进行改进。本文的改进策略主要体现在两个方面:第一,利用本体自身的概念结构和二叉树模型组织SVM多类分类器,使SVM算法适合解决本体实例的分类问题。第二,利用本体自身所蕴含的语义信息构造特征向量,选取分类效果更好的元素作为特征向量的维度。改进后的模型能够更好地处理有限样本数据的分类问题。本文设计了四组实验方案,实验结果表明,Onto‐Bt‐SVM模型分类的准确率和召回率都有大幅度的提高。
其他文献
顾客满意度是当今企业竞争需要把握的核心要素,在市场营销、社会学、心理学等领域都己经受到重视并得到了较为深入的研究。随着我国共享经济的不断改革,不断深化推进,我国的共享
自上世纪九十年代起,网络社区随着因特网的飞速发展而产生,其发展速度之快引起很多学者的注意。但是学者们对于网络社区的定义始终没有达成一致,多数著作都认为网络社区是指包括
复杂网络经过多年的发展,取得了丰硕的研究成果,受到来自各个学科领域研究者越来越多的关注。Internet,WWW,铁路交通网等社会经济生活中的很多系统都可以用复杂网络来描述。复杂网络中的节点表示系统中的对象,节点之间的边表示对象之间的联系。演化博弈理论源于达尔文的进化论,常被用于研究群体行为。假定群体中的个体都是有限理性的。有限理性个体在博弈过程中都希望得到当期的最大收益,所以都倾向于采取背叛策略
在产品更新换代速度越来越快的今天,消费者们也变得越来越聪明,越来越有策略性。策略消费者会考虑商品的未来效用,并选择相应的时机进行购买。针对这样一种消费者的出现,供应链中各成员企业不得不采取相应的应对措施。本文研究了在策略消费者存在的前提下,零售商的订货决策和生产商的质量决策问题。首先,本文从策略消费者的定义、行为机理、主要特点等方面对消费者进行了刻画。然后,文章针基于市场中存在策略消费者的前提下,
在知识经济时代,产业集群的发展对于促进区域经济发展有着巨大的作用。知识共享作为知识管理的核心关节成为产业集群内部存在的一种重要机制,已成为产业集群特别是高新技术产业
在当代,全球经济快速发展,使得市场在合作平台、贸易方式、交易种类及范围等方面都发生了巨大变化,而科学技术的广泛应用在改变了人们的生活方式的同时也带来了新的技术的变革和