不完整数据库中的关联规则挖掘研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:susan002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当前计算机学科的一个前沿研究方向,作为一门应用性很强的新兴技术,它存在很多值得研究的地方。如何合理的应用数据挖掘技术,如何针对现实生活中的问题改进数据挖掘技术是其中的热点问题。 在大型数据库中快速找出有关的关联规则是数据挖掘技术的一项重要内容。人们提出了很多方法,但这些方法往往假设数据是精确的,不考虑数据丢失的情况。但是在现实生活中数据丢失的情况是很常见的,尤其是在商业数据库中,文件错误、纪录缺失、存储策略的改变等都会引起数据丢失而造成数据库的不完整。这种数据的不完整性会影响找寻关联规则的过程,因为在有数据缺失时对项集的支持度以及信任度的计算得不到确定值。进一步,由于支持度以及信任度的不确定性,还可影响到所挖掘关联规则的可靠性和可信性。因此,有必要对在不完整数据库中的关联规则挖掘进行支持度及信任度的估算。本文正是基于这一点,把Apriori算法应用于不完整数据库,通过引入期望支持度和期望信任度的定义,提出了一个在不完整数据库中挖掘关联规则的算法。实验结果证明,所提出的算法具有较好的效果。
其他文献
在一个分布式的网络环境中,人们通过安全协议实现安全共享网络资源的需求,因此安全协议的安全性逐渐成为网络安全的关键。传统的安全协议分析技术包括传统的基于推理结构性方法
随着微系统技术、通信技术和计算机技术的飞速发展,20世际90年代术在美国发端了具有现代意义的无线传感器网络(WirelessSensorNetwork,WSN)技术。该网络由部署在监测区域内大量
如何进行正确的决策,对企业的兴衰成败有着重要的影响。计算机在零售业上的广泛使用使得人们可以利用数据库存储商品销售过程中产生的海量信息。这些信息蕴藏了丰富的经营知识
现有的软件体系结构(软件架构)设计模型由于过于侧重某一因素的驱动,在导出体系结构抽象、形成总体设计结构的作用上仍有所不足。 对此,本文在现有模型的基础之上提出了一种
本论文提出使用束搜索去解决港口停泊位置分配问题(BerthAllocationProblem),把BAP问题转化为一个多阶段决策的过程然后去求近似最优解。本文结合BAP问题给出了束搜索的整体实
移动Adhoc网络(MANET,MobileAdhocNetworks)以其灵活和易构的特性,最初主要为抢险救灾、野外研究、战场指挥等恶劣环境下的作业人员提供网络支持。近来随着研究的深入,MANET的
随着计算机技术、网络的飞速发展,信息技术已经被应用于大多数的社会领域。而信息安全是信息技术的重要环节,在军事,商业等领域有十分重要的意义,而访问控制是信息安全中的一个很
RTU作为SCADA系统的核心设备之一广泛应用于油气田现场,主要负责数据的采集、监控以及与上位机之间的通信,数字化油田的发展使得RTU进入到一个快速发展的时期,对RTU的设计也提出
多目标登机门分配问题是从经典的登机门问题加以扩展的一个新问题,传统的登机门分配问题多只考虑一个目标,例如乘客等待的时间最小,乘客步行的距离最小,机门的利用率最高等等。而
信息系统对时态信息处理技术的应用需求越来越迫切,目前时态信息应用系统的开发都迫切需要一个基础的时态信息处理工具来辅助相关的时态信息技术处理。受到传统的对象关系映射