论文部分内容阅读
随着信息技术的发展、经济全球化进程的加快,人们消费观念、消费模式、消费环境和购买行为发生重大转变;连锁零售业各个分布节点积集了大量关于客户的静态信息和动态交易数据信息,并与总店间通过网络互连形成了分布型的商业共享数据环境,形成了规模庞大的分布商业数据金矿。连锁零售业不能只依据某一结点的数据库进行经营决策,否则不能发现全面的商业信息,而需综合所有分布数据库,从中发现隐藏在大量客户消费数据背后的规则,获取分析决策模式和知识,让海量数据发挥出驱动营销业务的能量与价值,从而将零售业的“商品经营”演绎成“信息经营”,已成为企业研究的重点和难点。本文建立面向连锁零售业客户消费行为的分布式数据挖掘模型,有效利用分布式数据挖掘技术深度挖掘每个分结点中的数据库中客户消费行为信息、客户消费能力和客户消费趋势,支持连锁零售业在细分客户的消费行为中把握商机,提高企业的经营分析决策水平、最终提高企业的核心竞争力。主要研究内容包括:第一,针对目前数据分布环境下客户消费行为分析理论和研究存在的不足,提出了面向连锁零售业客户消费行为的分布式数据挖掘模型(DDMMRCB,Distributed Data Mining Model Based on Consumerbehavior Analysis):以连锁零售业分布的各结点的客户消费行为数据为数据源,以移动Agent运行平台为框架基础,以基于XML的异构数据处理、基于FP-树的分布式关联规则DARMAIF算法(DistributedAssociation Rules Mining Algorithms based on Improved FP tree)和分布式神经网络IDNNA算法(Improved Distributed Neural NetworkAlgorithm)为三大技术关键。第二,本文提出基于知识的元素映射集转换规则及动态匹配机制,并利用XML的可扩展性、结构化、自描述以及跨平台的特点,来解决分布式数据挖掘环境下异构数据源的挖掘问题。第三,本文提出基于FP-树的分布式关联规则DARMAIF算法,将局部站点的原始数据库进行分解并逐步组合成频繁1-项集的项总数个数据库子集,然后再将局部的子数据库的有关项集存储到改进的FP-树结构中,再通过基于被约束子树的数据挖掘算法,挖掘出约束项频繁项目集,并逐渐生成全局的基于约束的关联规则。第四,本文提出了改进型分布式神经网络IDNNA算法,在保留信息的前提下对数据进行有效降维,并通过分布式神经网络IDNNA算法的分布自学习功能得出客户评价的定量评价。第五,最后本文对DMMRCB模型在连锁零售业客户消费行为中的应用做了有益的探索,通过从客户个人特征、客户消费行为、客户态度等角度挖掘连锁零售企业的客户的消费行为,得出相关性分析、客户消费模式分析和客户分类等主题指标,从而为提高连锁零售业的经营分析、决策支持和商品管理等水平都提供了有力支持。