加权模糊关联规则挖掘算法研究及应用

来源 :江苏大学 | 被引量 : 13次 | 上传用户:radcuijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术尤其是互联网技术的快速发展,电子商务应运而生并逐渐普及。电子商务系统数据库积累了海量数据,但对商家决策有价值的知识却非常匮乏。关联规则作为数据挖掘(Data Mining)研究的主要模式之一,用于确定数据集中不同域或属性之间的联系,找出有价值的多个域之间的依赖关系,在网络购物中可用于为用户推荐相关商品,提高商家利润。由于其形式简单、易于解释和理解,目前已经成为数据挖掘中最成熟、最活跃、最重要的研究热点。本文正是对数据挖掘中关联规则挖掘算法进行研究,并将研究成果应用到某电子商务网站的个性化推荐系统中。本文主要研究内容如下:首先,总结当前的研究现状,给出数据挖掘相关概念及其基本方法和难点,重点介绍最经典的关联规则挖掘算法Apriori算法。然后,提出一种基于矩阵的关联规则挖掘算法(BOMA)。该算法利用项集的有序性构造一个矩阵,通过逻辑计算得到频繁1-项集以及最大频繁集,进而基于已获得的频繁项集和矩阵获得所有的频繁K-项集。相对于Apriori算法,BOMA算法提高了效率,对挖掘大量事务集中关联规则是快速有效的。接着,针对数量型关联规则挖掘中划分边界过硬以及规则丢失问题,提出一种加权模糊关联规则挖掘算法(NFWARM)。该算法基于专家定义的模糊区域和与之相关的隶属度函数,把数值转化为模糊值,避免了区间划分引起的边界过硬问题;同时,使用属性权重刻画元素对规则的贡献,在不引起规则丢失的情况下,保证了频繁项集的向下封闭性。最后,将文中提出的NFWARM算法应用到某电子商务网站的个性化推荐系统中。在提高用户操作友好性的同时,系统的挖掘结果能够对商家的经营决策起到积极的指导作用。
其他文献
桥梁结构作为现代交通系统的重要基础,其安全与健康不仅关系着国家的社会、政治、经济、国防等各项事业的健康有序发展,而且也直接影响着人民的生命、财产安全。然而,桥梁结构运
《中国家庭发展报告2015》指出家庭结构发展中家庭规模小型化和家庭养老需求与医疗养老结合的需求越来越大等特点。独居老人作为家庭成员中重要监护对象,多种老年疾病的影响
概念格理论,作为一种高效的数据分析工具,已经广泛地应用于数据挖掘、软件工程、信息检索等领域。其中概念和概念格是此理论的基础,在一般情况下,概念格中的概念数是输入背景大小
随着计算机网络的迅猛发展,社会化标签系统成为众多新型网络应用的不可或缺的一部分,并因其操作便捷、操作简单等优点深受互联网用户的喜爱。标签推荐系统可以推荐相应的标签
云计算已经成为人们工作、生活中不可或缺的一部分,尤其是提供海量存储的云存储服务。云存储服务由于其经济、易用、泛接入等优点,受到众多中小型公司、机构及个人用户的青睐
锂离子电池应用领域广泛,评估其健康状态成为研究热点也就不言而喻。但拥有复杂电化学特性的锂离子电池,其容量会伴随不断循环充放电过程呈现退化趋势,当容量退化至失效阈值(通常为额定容量70%~80%)时,即视为锂离子电池寿命到达终结状态。故进行锂离子电池剩余寿命预测研究,有利于提高系统可靠性,预防事故发生,具有重要研究及应用价值,已成为电池系统健康评估重要研究内容。近些年,在锂离子电池剩余寿命预测方法中
传统的入侵检测系统(IDS)存在着大量的问题:对未知网络攻击检测能力差、误报率高、占用资源多;对攻击数据的关联和分析功能不足,导致过多的人工参与;对于现在广泛使用的脚本攻击
网络的开放性和动态性使得信息系统所面临的用户需求和计算环境更加频繁地变化,从而要求信息系统应具备一定的自适应演化能力以灵活自主地适应这种变化。由于目前信息系统多属
文本分类可以为文本提供有序的组织,网络信息的增长使文本分类对信息处理的意义变得更加重要。二十世纪八十年代以后,基于机器学习的文本自动分类方法越来越成为主流,它具有
纹理图像分割作为图像处理和模式识别中一个重要的研究内容,一直以来是人们研究的热点。由于纹理图像不同于简单的图像,它具有大量复杂的纹理信息,因此,纹理图像的分割相对来