【摘 要】
:
目前国内外对关联规则算法的研究主要集中频繁项集的挖掘和规则的裁剪优化两个方向,研究成果颇多,但是针对零售数据目前还没有一个普遍认为最合适的算法。另外,根据零售业管
论文部分内容阅读
目前国内外对关联规则算法的研究主要集中频繁项集的挖掘和规则的裁剪优化两个方向,研究成果颇多,但是针对零售数据目前还没有一个普遍认为最合适的算法。另外,根据零售业管理人员的信息反馈,目前零售数据关联规则挖掘存在的主要问题是:挖掘出的关联规则太多、系统运行速度比较慢、实用性不强。本文针对零售数据的特点,在算法的挖掘效率和挖掘质量两个方面的进行了深入的研究,通过分析零售数据库找出顾客的购买习惯,并解释挖掘结果,对促进将关联规则数据挖掘技术应用到零售业中积累了相当的经验,对于其他领域的数据挖掘应用也有一定的借鉴价值。本文在频繁项集挖掘方面,首先详细阐述了关联规则经典算法Apriori算法和FP-growth算法,然后通过分析零售企业的商品结构、销售策略以及销售方式,得出零售数据的特点。针对零售数据的特点我们提出了基于多最小支持度的MSApriori算法和CFP-growth算法,采用VC++对上述算法的性能进行验证分析和比较,实验显示CFP-growth算法的性能稳定,而且能够有效的控制算法挖掘的时间,在实际挖掘过程中,取得了很好的挖掘效果。本文在关联规则度量方面,首先阐述了传统的支持度-置信度体系,然后针对多最小支持度算法产生庞大的规则集问题,引入了兴趣度的概念,提出了基于距离的兴趣度关联规则算法,给出了算法的原理和步骤,实验证实该算法在实际挖掘过程中,取得了良好的效果。本文最后把以上的研究成果应用到潍坊某零售集团股份有限公司的商业智能系统BISYS中数据挖掘的研究中,对该超市的POS数据进行提取、清洗、整理、挖掘及结果展示,并将最后结果反馈给超市,取得了较好的成果。
其他文献
从经济性和可靠性两方面,对包含110kV高压配电网和10kV中压配电网的城市组合电网接线模式进行了分析比较。采用了一种供电面积可调的分析模型。根据负荷密度和变电所容量大小
新农合支付方式改革是医改的重要内容,也是新农合制度不断完善和发展的重要保障,它的有效实施既有利于提高农民的实际收益水平,也有利于新农合基金的持续稳定发展。文章以支
列斐伏尔以马克思主义政治经济学理论为批判的武器,分析资本主义城市空间城市消费的特点和作用,指出资本主义正是借助于城市空间的生产和消费才存活到今天。他还站在全球化的
介绍电器控制的新式智能继电器 ,以及用智能继电器完成静电除尘器配套的电动机、加热器等设备的智能控制 ,构成网络式静电除尘器低压控制系统 ,提高了低压控制装置的可靠性和
小型微型企业生存发展状况是宏观经济政策的"晴雨表"。本文通过阐述小型微型企业的性质与功能,根据小型微型企业的发展近况,着重分析了当前小型微型企业经营发展过程中遭遇来
投资者的决策如何影响金融市场定价问题一直是行为金融的研究热点,本文不同于传统衡量投资者关注的被动替代变量,采用投资者主动行为产生的百度指数作为研究变量,通过建立回
分析中西医联合治疗方法对胃十二指肠溃疡疾病的治疗效果及安全性评价。自2008年1月~2013年12月,本院采用中西医结合治疗胃及十二指肠溃疡120例,并与单用西医治疗132例作对照
保险代位求偿权虽然为保险人的一项法定权利,但并不意味着其行使该权利不受任何限制。首先,保险人因为弃权在行使代位求偿权时权利受到一定限制及至丧失该权利;第二,第三人可
发动机是汽车动力的来源。随着其工作性能的不断改善、电子化程度的不断提高,其结构也变得越来越复杂,虽然发动机发生故障的概率并不是太高,但是一旦发生故障将很难诊断。随
第一部分:SELDI-TOF-MS技术筛选强直性脊柱炎患者血清特异性蛋白质的研究目的:应用表面增强激光解析离子化/飞行时间质谱(SELDI-TOF-MS)和蛋白质芯片技术检测强直性脊柱炎(AS