基于梯形云模型的数量型关联规则挖掘方法

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:selangzhiyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
挖掘关联规则是数据挖掘领域的一个重要的研究方向。本文以数据挖掘中关联规则的挖掘为主要研究内容,首先对关联规则起源、应用环境、分类、思想、算法的优缺点等进行了分析学习。介绍了挖掘布尔型数据两种比较流行挖掘算法:生成大项集的Apriori及不用生成大项集的FP-Tree算法,对比分析了两种挖掘算法优缺点。目前,针对布尔型数据的挖掘算法已经比较成熟,而对数量型数据的关联规则挖掘还处于发展阶段。对数量型数据的关联规则挖掘可以有很多种方法,比较直观的思路是将数量型数据转换成布尔型数据进行挖掘,然而传统的转化方法存在属性区间划分不尽合理的问题,导致挖掘的结果没有意义。 本文在李德毅院士提出的云模型的基础上,根据实际应用对正态云模型进行扩展,提出将数量型数据转化为布尔型数据的定性定量不确定性转换模型-梯形云模型,该模型把定性概念的模糊性和随机性完全集成到一起,同时又肯定了人们对模糊知识中的完全认定的部分,实现了定性概念与定量数值之间的自然转换。基于该模型的概念划分算法得到的概念反映了此属性中数据在定义域中的实际分布情况,同时由于概念的边界是模糊的,不确定的,因而不是一种硬性的划分方法,所得到的结果更加符合人的思维。在此基础上给出的数量型挖掘算法得到的数值型关联规则具有有效性和可理解性,能够从数据中挖掘出更有意义的知识。
其他文献
面对因特网上日益增多的在线可读文本,文本过滤旨在帮助用户获取自己感兴趣的文本,实现信息服务的个性化,因此它具有广泛的应用背景和较高的实用价值。 文本过滤的形式可大致
在过去的几年中,对等网络(Peer-to-Peer,简称P2P)已经成为一种计算和应用的潮流.越来越多的互联网用户通过Napster,Gnutella,BT下载这样的P2P软件相互交流共享文件,而通过类
近年来,随着多媒体技术、计算机网络与通信技术的快速发展,传统的视频监控系统也朝着新的方向进行着不断地更新与发展.进而出现了集多媒体技术、计算机网络与通信技术于一体
在过去的十年中,传真是商务活动中必不可少的通信工具。随着Internet日益蓬勃发展,基于PSTN的传统传真方式将难以满足人们希望使用方便、价格低的传真服务的要求。而现今IP传
在软件工程研究的发展中,面向功能的结构化方法和面向对象方法最被广泛应用。传统软件开发方法的基本技术是结构分析和结构设计技术,它是围绕实现处理功能的“过程”来构造系统
信息时代给人类社会带来了新的挑战和机遇,传统的以教师、课堂、课本为中心的教学模式将越来越不适应信息社会的需要。随着计算机技术和网络技术的飞速发展,利用网络进行教学已
DNA是遗传信息的载体,遗传信息的作用通常由蛋白质的功能来表现,但DNA并非蛋白质合成的直接模板,合成蛋白质的模板是RNA。RNA二级结构预测问题是计算机科学和生物信息学的基
从海量网络资源中获取企业基本信息,为企业的客户关系管理、潜在竞争对手发现等提供信息支持,对于企业的生存和发展壮大具有重要意义。鉴于通用搜索引擎处理这类问题时存在的
“嵌入式Internet”是后PC时代信息技术发展的必然产物。信息共享程度的不断提高,使得Internet应用从以PC为中心转向以嵌入式设备为中心。嵌入式系统接入Internet以后,可以方
在高动态GPS接收机中,由于要对多通道连续跟踪,实时数据运算处理量大,因此对微处理器的性能要求较高。除性能外,对功耗和体积也有很高要求。刚好在移动通信领域得到广泛应用的ARM