数据库中关联规则及效用模式挖掘算法的研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:lcc54202346
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着数字化在各机关企业中越来越普及,数据库在各个企业中的角色也就越来越重要。数据库所累积大量的数据中往往隐藏了许多有用的重要信息,如何能够有效率且正确地发掘出这些信息就变成为一个重要的课题,因此数据挖掘技术随即应运而生。目前数据挖掘中应用最广的技术就是关联规则的挖掘,许多的相关技术及研究已经被提出。关联规则挖掘模型以平等的方式对待每个项目(item),只考虑项目是否在事务记录中出现。但是在实际的情况中,项目之间的是有明显区别的,我们可以将这种区别定量化,其中一种方法就是以效用来衡量项目之间的区别。本文在研究提出关联规则新算法的同时,对另一类问题,效用模式的挖掘也作了细致的研究。效用模式挖掘是一个全新的挖掘技术分支.效用模式发现问题是和关联规则,序列分析较为相似的一类问题,它们有共同的数据背景------从购物篮数据延伸开来的客户记录数据。和另外两者的挖掘类似,效用挖掘也是从这些数据中寻找潜在有用的,非平凡的支持决策的新知识。只是更加侧重满足最小效用值,可以看成是一种带有约束的项集挖掘。本文延续了对关联规则的研究,给出了一种基于划分和分解的算法,该算法基于划分的思想,只需扫描数据库一次,较大的减少了候选项集的数量,也缩小了检验候选项集时考虑的范围。实验表明该算法在效率上有较大的改进。针对效用挖掘的情况,本文在总结前人研究的基础上,将问题转化为一个最优化问题,提出一种基于二分划分树的启发式算法,该算法能有效的在数据中寻找效用模式。相对于基于剪枝的效用模式发现算法,该算法性能上有较大的突破。本研究的主要内容为有效的关联规则算法和效用挖掘新算法,通过在实验中对比算法的性能,验证了研究成果的先进性。
其他文献
在信用卡欺诈监测、差异性营销、网络入侵检测和传感器网络等应用中,随着时间的更迭而生成一种新型的具有连续、有序、变化、快速到达、海量等特征的数据,即“数据流”,其数据量
本文基于固网短信系统项目的研究与实现,研究了固网短信技术的基本原理以及使用到的关键技术和协议,如CTI技术、FSK技术、DTMF技术、ADSI协议、SMTP协议等。分析和设计了系统的
本文首先对手写数字图像的图像灰度化、二值化、去噪、细化、归一化、特征提取等预处理过程进行分析;其次,利用动态模糊理论解决手写数字字符识别中的多维特征和动态模糊性问题
目前,传统的DVD碟片容量已无法满足观看高清晰视频节目(分辨率1920×1080)的要求。蓝光光盘价格居高不下,且转产成本高,而国内厂商也面临着DVD专利困扰,这些都表明了开发一种
知识表示一直是人工智能研究的重要课题,无论应用人工智能技术解决什么问题,首先遇到的就是所涉及的各类知识如何表示。在人工智能领域,对知识的表示有多种方法,但一般都受其
随着互联网的迅猛发展和网民数量的迅速增长,网站的功能也不断扩展,由此造成了人们参与网络活动的方式不断演化,即从简单的获取信息到直接参与网络内容的建设。网络逐渐成为了信
学位
无线传感网络是指由无线传感网络节点通过无线通信组成的网络。无线传感网络技术在最近十年来得到了飞速的发展,开始从学术界研究走向商业应用。然而硬件技术的进步并不会使无
本文将语音信号处理技术应用在外语语言学习中,设计实现一个可以自动评价中国人英语发音质量的系统。该系统集中了人类发音专家的知识,可以自动比较学习者的发音与标准发音之间
随着社会的发展,信息化进程的加快,计算机应用已经深入到各行各业,专注于流程描述的工作流技术就是其中的一个重要应用,在办公自动化、电子政务、制造生产等方面都可以用到相关技