基于概念格模型的分布式关联规则挖掘研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:wolf12066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式关联规则挖掘研究是为解决分布式环境下的关联规则挖掘问题而出现的新课题,具有重要的理论和实际意义。概念格通过概念的内涵和外延之间的关系以及泛化和例化之间的关系来表示数据和知识,因而适用于关联规则发现的问题研究。然而,由于格结构的完备性致使格的规模随数据库规模的增长而快速增长,一定程度上影响了概念格模型在知识发现研究领域中的应用。本文在对概念格及其扩展模型进行研究的基础上,着重研究了基于剪枝概念格模型的分布式挖掘关联规则问题。 论文主要工作如下: (1)在深入研究概念格上数据和知识表示的基础上,着重讨论了概念格剪枝模型的相关理论,并给出了相应的剪枝格构造算法。 (2)比较研究了基于剪枝概念格上频繁项集表示与基于Apriori性质的频繁项集表示方法,发现前者能够更加简洁地表示频繁项集、更加精确地反映原始数据库中的关联信息。 (3)研究了利用剪枝格模型从多数据源上提取关联规则问题;给出相应的算法UMPL,并用实验证明了算法的有效性和正确性。 (4)实现了基于概念格的关联规则挖掘原型系统。
其他文献
近年来,无限状态系统的验证成为了一个十分热门的研究领域。其中研究的重要问题不仅仅有对系统间等价的判定,还包括对系统和特定有限系统的等价性和系统的有限性判定。有限性问
离散事件动态系统(DEDS)是实际生活中广泛存在的一类人造系统,而半Markov决策过程(SMDP)是这类系统建模的主要方法之一。为了适应对于大状态空间离散事件动态系统优化控制的
随着计算机技术和工程项目管理的发展,传统的二维、静态信息可视化已经不能满足现代工程项目管理的需求。现代工程项目管理需要在互联网上直观、动态、高密度显示信息并能进行
在当前生活中,搭乘出租车逐渐成为人们日常出行的一种重要选择。一般来说,出租车司机凭借本人经验或者随机行驶去寻找乘客。但是,由于对乘客出现信息的缺乏,这种寻找乘客的行驶在
将传统观念中模糊的“测试”概念在软件的开发过程中明确化、规范化,提出了软件设计、软件编码和软件维护分别与测试设计、测试编码和测试维护同步的思想。详细分析了测试用例
网上购物由于具有方便快捷、成本低、效率高、选择性强等优点,已经被越来越多的人所接受,并成为一种不可忽视的商业形式。然而,在网上购物的最初阶段,消费者为了找到满意的商品,往
近年来,数据挖掘的研究得到了快速发展,数据挖掘的成果已经广泛地被运用到了许多行业。时态数据挖掘是数据挖掘研究的一个重要的组成部分。时态特征聚类作为时态数据挖掘的一个
随着Internet的发展,越来越多的高带宽需求的多媒体应用带来了带宽的急剧消耗和网络拥挤问题。多播是一种介于单播和广播通信之间的数据传输方式,它提供了一种一到多或者多到
PLC技术、网络技术及数字设备的不断发展,促使工业控制从传统的模拟控制逐步走向数字控制,从分散控制走向集中控制,从人工操作发展成为计算机控制。计算机软硬件技术已经渗透到
车载监控终端集全球定位技术,移动通信技术和地理信息系统技术于一身,它不但是智能交通系统的重要组成部分还能实现许多安全防范功能。 本文通过对GPS卫星定位理论、卫星数