基于本体的数据清洗系统框架研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xiaolinshihonggang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的飞速发展以及数据获取手段的多样化,数据资源日益丰富,数据量急剧增加。数据的价值在于其自身的质量,基于劣质数据的决策支持具有不可信性,目前数量巨大而且零乱的劣质数据成为制约数据应用的“瓶颈”。因此,作为数据质量问题的主要解决技术,数据清洗成为研究的热点。然而现有数据清洗技术的研究大多是从数据文本取值的层面进行清洗处理,往往忽略了数据自身蕴含的语义信息。因此,如何在现有数据清洗研究中引入语义特性成为该领域一个新的研究点。针对这一研究课题,本文主要开展了如下几个方面的研究工作:首先,基于信息化建设的背景,对数据质量问题和数据清洗问题进行了研究。通过对该领域在国内外研究现状的分析,归纳了现有数据清洗研究中存在的不足,并论证了利用本体及相关技术解决上述不足的可行性。其次,针对知识表示及其常规性的方法,本体及相关技术的研究进行了总结,作为支撑论文研究的理论基础。然后,基于本体提出了一个数据清洗系统框架。按照资源描述的特性,将系统框架划分为描述静态语义信息的本体表达模型和描述过程语义信息的动态处理模型,并分别给出了模型中各组成部分的形式化描述和主要模块在处理过程中的工作原理和实现机制。最后,在对课题研究中的两个语义模型进行分析介绍的基础上,设计并实现了基于本体的数据清洗系统框架,并使用UML对框架的静态结构设计和动态行为语义进行了建模,解决了现有数据清洗研究中缺乏语义约束和不能支持自动推理的问题。
其他文献
随着近几年来社交媒体的流行,信息的产生、传播、分享变得越发容易。人们只需要通过发布微博,更新自己的社交状态就能同来自世界各地的人们通信,交朋友,甚至进行商业贸易。电
无线传感器网络技术是随着传感器技术、微电子技术、网络与通信技术和嵌入式系统等技术的发展而产生的一种较新的技术,目前在国内科学界和工业界都属于研究的热点领域。无线
工作流作为实现现代企业业务过程管理和运行自动化的关键技术,可以帮助企业提高运营效率、改善资源利用、提高运作的灵活性和适应性。本文对基于工作流的智能企业协同门户技
随着计算机技术、超大规模集成电路、控制理论、人工智能、传感器技术等的不断成熟和发展,由多学科交叉而形成的多机器人学研究也进入一个崭新的阶段。由于Agent理论的出现和
合成孔径雷达(Synthetic Aperture Radar,简称SAR)具有全天候、全天时、高分辨率、强透射等特点,被广泛应用于民用和军事领域。SAR是一种相干成像系统,因此所成图像含有大量的相
论文在研究现有经典的人脸检测与识别算法的基础上,构建了一个计算机视觉应用系统框架,并围绕着“人脸检测”与“人脸识别”两大任务,实现了该框架的系统原型。首先,对Viola
传统的备份技术实现的数据保护间隔一般为24小时,属于冷备份技术;采用快照技术实现热备份,可以将数据的丢失风险控制在几个小时之内,但是快照技术只能保存快照点上的数据卷的
人脸检测是模式识别和计算机视觉领域的一个重要研究方向,具有非常广泛的实用价值。本文在对人脸检测的国内外研究现状进行深入分析的基础上,对人脸检测的速度和鲁棒性进行了探
视频人体运动分析[1][2]是计算机视觉和计算机图形学相互融合的一个重点研究方向,其研究核心是从单个或多个视频序列中检测、跟踪人体,获取人体运动数据,重建人体的三维运动
IPTV即网络电视,是利用IP网络向用户提供各种实时、非实时多媒体业务的交互式网络电视。它是利用现有的双向IP网络系统提供直播电视、点播节目、时移电视为主的交互式网络电