基于预购车数据的数据挖掘分析

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:xxxmcu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国民经济的持续稳定增长为汽车行业的发展提供了广阔前景,随着汽车需求量的不断增加,汽车行业逐步占据了国民经济中的重要地位.近年来,私家车购买比例迅速上升,越来越多的人倾向于购买私家车.为确定未来家庭轿车的主要消费人群,国家统计局通过调研建立了“私家车欲购车数据”.基于此数据,本文利用数据挖掘方法对该预购车数据进行了分析. 本文主要研究工作如下: 首先,针对究竟哪些消费者将成为潜在的汽车消费者这一问题,本文采用数据挖掘技术中的支持向量机和决策树方法,建立预购车数据分类模型.通过模型不但可以把潜在消费者和非潜在消费者分开,而且还可以对新来消费者在未来三年内买车的可能性进行预测. 其次,考虑到在填写调查问卷的过程中,某些受访者出于保护自身隐私,常常不愿意真实填写其家庭收入,使得我们不能简单地从“家庭收入”来推断其财富状况,本文希望能从其他消费支出指标推断出其拥有财富的大体状况.基于此,用聚类的方法对数据进行了消费者财富指标分析。然后,按照这些指标将消费者进行分群,进而在不同的群体中,分别建立分类模型,对区分潜在消费者和非潜在消费者进行了进一步的研究. 此外,本文还用关联规则方法找出了和潜在消费者关联最密切的一些特征描述,并将各个城市中和消费者关联最密切的特征描述有何异同进行了分析.最后,为了从大量的特征中找出真正能区分潜在的消费者和非潜在的消费者的特征,本文提出了两个新的特征选择方法,实现对预购车数据的特征的约简,找出了包含最具有分类信息的十个特征.
其他文献
本文对基于广义误差分布的混合效应状态空间模型进行了研究。文章分为三个部分: 第一章,模型介绍部分,首先介绍混合效应状态空间模型(MESSEM)的基本形式。在其基础上,建立新模
期刊
BP神经网络是目前应用最广泛的前馈神经网络模型之一。但其收敛速度慢也成为它的一个重要局限。高阶神经网络既拥有比BP神经网络更强的非线性分类能力,又将训练时间大大减少。
名著《水浒传》家喻户晓,其作者施耐庵系我镇施家桥村人。水浒文化博大精深,是构建校园文化、弘扬地方文化传统、对学生进行文化熏陶的好素材。基于此,为创建特色学校,我校确
随着越来越多的政客宣布参与角逐2016年美国总统大选,美国的媒体们也已摩拳擦掌,迎接大选新闻战。最新的强势参与者,是一个出乎所有人意料的角色:Snapchat。Snapchat是什么?
期刊
期刊
自从 Adler RL-Konhrim AG-McAndrew M H 给出紧动力系统拓扑熵的定义以来,它就被认为是连续作用在底空间上引起的运动混乱程度的一种度量,而估计和计算拓扑熵就成了紧动力系统
“欢迎小编机器人@编形金刚加入我们!希望你能写出更好更有价值的文章!”3月10日,海外媒体硅谷新闻社的新浪官方微博(@硅新社)上发布了这样一条信息。随后,一条条由“编形金
期刊