基于不确定数据的语义本体构建及其在云环境下的应用研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:a692039471
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
1982年,Z.Pawlak提出粗糙集理论,为处理不确定数据提供了一个很好的方法。近年来,粗糙集理论及其应用发展发展十分迅速,主要都着眼于粗糙集模型的概化、粗糙集中不确定理论的分析、粗糙集相关操作及其关联性、粗糙集与其他数学理论的联系等等。现在,粗糙集理论已经应用于很多研究领域,比如机器学习、决策分析、进程控制、模式识别、数据挖掘等。而在信息检索领域,粗糙集也常被用于表达信息的不确定性,来将信息检索扩展到语义检索方面。本文中,将对粗糙集在语义检索及语义本体构建中的作用进行研究。目前,对本体的定义很多,其中最著名定义是由Gruber提出的,“本体是概念化的明确的规范说明”。应用于计算机领域的本体从概念上说是个实体,就是把现实世界中的某个领域抽象为一组概念及概念之间的关系。本体技术关注的概念的共享,是智能主体在相互交流中对特定领域问题的基本概念范畴的共同约定,它非常适合于描述互联网上各种不同的、分散的、半结构化的信息资源。通过定义共享的、通用的领域理论,本体帮助人和计算机明确的交流,使人类、计算机能够实现知识的共享和重用,方便地进行知识的交互和协作。语义本体是在一定领域内,根据本体论理论基础上对现有语义网内所有文本信息所进行的分类和结构化,在本体支持下实现信息系统间语义上的互操作性,以及对网络资源所进行的智能访问和检索。随着语义本体的广泛应用,如何快速而精确地构建语义本体也变得非常重要。作为构建语义本体的重要环节,形式概念的特征提取是必不可少的。在数据挖掘领域中,不确定数据的重要性日益提升。其中粗糙集理论已经多次被应用于文本特征提取,并且进行了不断的改进。而模糊数据跟自然语言的紧密联系也使其成为了语义本体构建过程中不可或缺的一部分。另外,在云环境应用日益广泛的今天,如何在云环境下对本体构建进行部署和语义检索也是一个重要的课题。本文主要是基于粗糙集和其他不确定数据理论知识来进行语义本体构建的改进,并在此基础上,考虑了云环境下语义本体的构建框架和基于此框架的语义检索流程。主要研究工作包括:(1)结合动态粗糙集理论与欧氏距离,对现有的文本特征提取进行改进。综合考虑文本集合的特点以及用户的需求,并且摆脱了本体构建过程中对决定属性子集的依赖,对文本进行更加快速精确的特征提取。(2)基于模糊数据理论基础,结合层次聚类和语义本体构建方法,对原有的粗糙语义本体构建方法进行了改进,提出了一个新的粗糙语义本体的构建方法,可以同时考虑数据分类的粗糙性和数据属性的模糊性。(3)针对云环境下的数据部署,提出一个语义本体构建的新方法,对云环境下的文本数据部署进行了规划使其更适宜于本体的构建,并提出适宜于云环境的语义检索流程。
其他文献
论文主要论述了企业建立数据仓库的必要性和企业数据仓库的建设过程,并从需求分析、数据路线、技术路线、应用路线等方面介绍了企业数据仓库的建设。提出了新型的企业决策管
目前高清/超高清视频点播服务日益流行,引起了越来越多的研究人员和互联网公司的关注,例如PPTV、YouKu以及Xunlei kankan等等。虽然高清视频点播服务给用户带来了很好的体验效
显著目标提取是检测视觉输入中具有独立视觉意义的显著区域(目标),对后续行为分析、语义判断、场景理解等高级视觉任务具有重要意义,是计算机视觉研究领域中经典课题。近年来
图形的真实感是指计算机生成的图形对客观世界的反映程度。纹理映射技术是真实感计算机图形学中的重要组成部分,广泛地应用于三维模型交互设计和动画游戏绘制等领域,它不需要
从指南针与天文定位技术在古代应用于航海,到今天的智能手机普遍配置卫星定位系统,人们用来帮助获取位置信息的技术一直在革新。目前卫星定位技术已成为室外定位的优势技术,而用
随着互联网技术的迅速发展,网络课程在国内外已经取得了令人骄傲的成果,先后出现了许多优秀的网络课程资源,此外,MOOC作为网络课程的一种新型表现形式,它在教育领域引起了的
由于发布/订阅通信机制能够使参与者在空间、时间和控制流上完全解耦,且具有异步、多点通信的特点,因此能够较好地满足许多大型分布式系统松散耦合通信的需求,成为构建大规模
乒乓球机器人是一个手眼协调系统,它包括机械系统,视觉系统和控制系统,分别相当于人的手臂,眼睛和大脑。而本文的重点是机器人的控制系统,即如何有效的控制机器人的手腕使其
近年来,无线传感器网络(Wirless Sensor Network)技术异军突起,成为本世纪最具影响的技术之一。   无线传感器网络(Wireless Sensor Network)因其广阔的应用前景,受到了人们
传统搜索技术一方面能够提供给用户丰富的信息,但另一方面也给用户带来大量的噪声和冗余的数据,使用户难以分辨出自己感兴趣的信息。为了满足互联网用户的个性化需求,给用户