条件独立性在关联规则挖掘中的研究和应用

来源 :河海大学 | 被引量 : 3次 | 上传用户:yuyuan0127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的应用普及,数据爆炸和知识贫乏之间的矛盾越来越大,使数据挖掘的深入研究和广泛应用势在必行。在数据挖掘的各分支中,关联规则挖掘的研究最为深入和广泛。对关联规则挖掘的研究又主要集中在频繁集的生成优化和事物集的扫描次数两个方面,并且主要基于支持度---可信度框架,由于这种框架的自身缺陷,使挖掘的关联规则中用户感兴趣的却不多,因此如何使用户对挖掘的关联规则更感兴趣又成为一项新研究任务,不少学者不采用支持度---可信度框架,尝试采用新方法来进行关联规则挖掘,以提高用户的满意度和兴趣度。本文正是在这种背景下,研究基于条件独立性的关联规则挖掘的算法框架;研究如何在传统关联规则挖掘的基础上,利用条件独立性进行后处理,提高关联规则的有趣性。 本文的主要内容如下: 1.探讨了传统关联规则挖掘的主要思想和技术,分析了各种频繁集裁剪技术和兴趣度度量。 2.给出了一种利用马尔可夫覆盖进行关联规则挖掘的算法框架,并研究了算法中的各个组成部分。 3.提出了多项集的马尔可夫覆盖的生成方法,证明了其正确性,然后探讨了多变量马尔可夫覆盖的贝叶斯网络表示形式。 4.面向教育评估系统中的具体应用,本文提出了对原有系统中采用的Apriori算法挖掘的关联规则进行后处理的方法:采用条件独立性和传统支持度---可信度框架相结合的方法进行关联规则的过滤,并从中发现存在的条件独立性限制。
其他文献
对等网络P2P(Peerto Peer)是Internet网实现下一次飞跃的关键,该文首先分析了P2P网络以及它和其它传统网络模式的差别,P2P模型,P2P现有的应用各种模型的优势及不足之处.提出
随着信息产业的迅速发展,信息检索技术也日益成熟并得到了越来越广泛的应用。另一方面由于缺乏有效的管理手段,导致互联网上不良信息泛滥。为此,本文的研究工作是对一个现有
农业在中国的国民经济中起着举足轻重的作用,可是目前中国的农业还比较落后,而信息的缺乏是制约中国农业发展的瓶颈.信息农业是农业现代化的重要发展方向之一.Internet的迅速
准确获取一条路径上的可用带宽对于IP网络有效地实施QoS服务至关重要,如端到端的接入控制,服务器选择,路由选择,拥塞控制,验证SLA等。目前可用带宽的测量多采用主动测量方式,由于现
随着移动通信技术的迅速发展,在移动通信领域中出现了越来越丰富的业务种类,以移动网络为平台的应用得到越来越多的重视和推广。这些新兴的业务对通信中的信息安全提出了更高的
随着多媒体、网络技术的飞速发展,图像的应用日益广泛,大量的图像数据成倍增长,如何有效的管理和检索图像,已经成为人们迫切需要解决的问题,图像检索技术正成为国内外研究的一个热
近年来,随着计算机技术的迅猛发展,同时定位与建图(Simultaneous Localization and Mapping,SLAM)技术在移动机器人、无人机、无人驾驶、视觉医疗、AR/VR、可穿戴设备等方面
进入九十年代以来,以IP为基础的Internet呈爆炸式增长,新型网络的应用不断涌现,用户数量迅速增加,使Internet的流量急剧增加,由此而引发的网络拥塞已经成为制约网络发展和应用的瓶
随着网络安全的发展,单纯的被动的静态安全防御策略已经无法满足现实需要.人们开始采用动态安全防御的思想来进行安全防护,入侵检测系统是动态安全防御里的重要环节.但是,现
当前的数字水印技术大多是针对文本、图像,视频、音频等媒体数据类型,而对三维几何模型的数字水印技术的研究工作相对较少.但是,随着虚拟现实和Web3D技术的飞速发展,以及越来