关系数据库中空值估计算法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:lelefeng123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今关系数据库理论模型已经近乎完美,而且各种关系数据库系统几乎在各个方面都非常成功。传统的关系数据库理论是建立在信息完全的基础之上的,不允许缺失信息的存在,这和早期的数据库管理系统的处理能力是相适应的。但由于客观世界的复杂性,信息缺失、不确定信息以及模糊信息是普遍存在的。数据库作为表达现实世界的手段,不可能回避信息缺失问题,因此就需要处理缺失信息的估值问题。本文主要针对关系数据库中的空值缺失问题进行研究,对空值估计算法进行改进并利用基于Vague集的方法对数据重新聚类。首先提出了一个使用数理统计方法和K-means聚类方法来改进算法,其次根据数据聚类的思想,提出了一个用隶属度函数对数据进行转换并重新聚类的方法,这种方法不仅给出空值的一个具体的估计值,而且可以给出它最有可能的分布区间,并可以对一些非数值型空值进行估计。最后是利用相容对象的元组可以互相补偿丢失数据的思想给出了另一个估值方法。同时利用平均误差率来考察算法估值的准确率,并且给出了算法的主要实现步骤和流程。
其他文献
自从1946年,第一台电子数字计算机ENIAC在美国宾夕法尼亚大学诞生以来,人类的生活因计算机而彻底改变。计算机的使用遍及世界的各个角落。计算机技术被人们认为是当今三大必
编排(Choreography)和编制(Orchestration)是常用于描述合成网络服务的两种方式的语言。前者从一个整体的视角定义了系统中各服务之间的交互,而后者仅从一个服务的角度定义了
随着Internet应用的日益普及,如何保证网络设备可靠、安全、高效的运行,成了一个函待解决的问题。一个好的网络管理系统可以对各种网络设备及其软件资源进行有效的监视、解释
移动增值业务逐渐成为移动运营商增加业务收入的主要手段,而且,随着移动增值业务的用户数量的迅猛发展,移动增值业务的内容也越来越丰富,因此,为各种无线增值业务搭建统一而
为了在图论和集合论理论指导下确定方便、实用的工作流模型,论文介绍了基于活动网络的建模技术,给出了活动网络的有向图定义。这种有向图定义可以进一步扩展模型语义,增强模型表
随着用户对通信业务的需求逐渐由语音需求变为对数据、图像和语音的综合需求,传统的通信网络已经越来越不能满足人们日益增长的需要,全球范围内对“互联网、传统电话网、有线
向量网技术是一种新型的网络技术,向量网设计了一种基于PNNI的网络拓扑结构表示法,提出向量地址的概念,利用向量地址进行数据传输。向量地址是一种新的编址方案,它基于端口号而不
数据流是目前的一个新兴的热门领域,国内外学者都纷纷提出各种数据流处理的技术、算法和各种具体应用项目。数据流是一个按时间到来的有序的项集。和传统静态数据库中的数据不
随着互联网技术的迅猛发展和网络应用的日益普及,互联网对人们工作和生活的作用越来越重要,但是由网络而引发的问题也随之而来。企业员工通过网络进行私人聊天造成工作效率降
铁路是国民经济的大动脉,在国家的经济发展中承担着光荣而又艰巨的先行任务。推进铁路电子公文建设,是铁路行政部门转变工作职能和工作方式、提高管理效率、实现政务、厂务公开