基于随机森林模型的二手车价值评估研究

来源 :河北经贸大学 | 被引量 : 3次 | 上传用户:dgmlovett
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随我国经济的发展,汽车市场日渐繁荣,在新车保有量逐年攀升的同时,也有更多的消费者从观念上接受了二手车。截止2019年底,我国二手车交易量已高达1492.28万辆,交易量的上涨不但促进了二手车行业的发展,也对二手车价值评估提出了更高的要求。但由于我国不同地域的二手车市场发展不平衡,评估数据缺乏、评估信息不对称和评估过程成本高等问题会限制传统三种评估方法的使用。因此,寻找到一种能满足我国二手车市场需求的评估方法十分重要。随机森林作为一种机器学习模型,采用计算机算法实现,在数据处理上有独特的优势,如能够应对样本中有一定噪声和数据缺失的情况,因此本文在二手车价值评估研究中引入随机森林模型。首先,根据均方误差的平均递减程度对分类赋值量化后的15个特征变量进行重要性排序与筛选,组建二手车价值评估的特征变量体系。体系中共有10个特征变量,按照不同属性分为实体变量、功能变量和市场变量三类。其次,通过多次测试对随机森林模型中两个重要参数,单棵决策树每次生长时随机抽取的变量个数和决策树数量的最优选值进行确定,并将样本按照8:2的比例分成训练集和测试集,依据训练集数据建立基于随机森林的二手车价值评估模型。最后,使用测试集进行指标衡量和误差分析检验模型评估精度,选取的衡量指标有模型拟合优度、平均相对误差、平均绝对误差和均方根误差。经过计算分析可知,模型整体运行表现良好,拟合优度高达93.49%,评估值和真实值之间的误差大多集中在10%以下,随机森林模型在二手车价值评估中有较强适用性。且通过对二手车价值评估特征变量体系分析可知,新车价格这一特征变量对二手车价值的重要性最高,其次为上牌时间和行驶里程。本文从理论角度出发,建立了基于随机森林的二手车价值评估模型,在降低评估成本、提高评估效率的同时,还能满足市场的发展需求,为二手车价值评估提供一种新的思路。通过测试集数据实证可知,该模型能够适用于不同品牌、不同配置、不同地域的车辆评估,只需要向模型中投入待评估车辆的信息,就能快速得到评估结果,评估过程简单易操作,模型具有一定的使用价值。
其他文献
探讨p53和ras p21蛋白的表达与眼睑肿瘤临床预后的关系。方法 采用免疫组化SABC法检测了98例眼睑恶性肿瘤组织中p53和ras p21蛋白的表达。结果 在鳞状细胞癌旁正常及轻度不典型增生上皮中未见p53和ras p21蛋白
司法权是公权力,人民法院在裁判文书中援引宪法的行为可以视为公权力对于宪法的运用。从这个角度看,法院援引宪法的行为为宪法司法作用力的发挥提供了实践层面的正当性。本文
在化工企业生产中,将开关变压器作为频繁或重载大惯性负载起动的高压电机软启动装置可以达到起动稳定、安全可靠、节能高效的目的。以聚氯乙烯装置应用为例,阐述开关变压器软
"科学的绩效体系与医疗尊严,是一个相对古老却又非常年轻的话题。当医药卫生体制改革不断进入深水区之时,研究和讨论医院的科学绩效体系和医疗尊严关系问题,具有特殊的意义。"
中国人民银行从1998年起,取消对国有商业银行贷款限额控制,在逐步推行资产负债比例管理和风险管理的基础上,实行“计划指导、自求平衡、比例管理、间接调控”的新管理体制。此项改革
粮食企业实行顺价销售是国务院对粮食流通体制改革的一项重要政策。朱基总理在安微考察粮食工作时强调,国有粮食企业要坚持粮食顺价销售的原则,这是国有粮食企业不再发生新的
海南省文昌市农村信用社与农业银行脱钩以后,各项业务的经营都取得了一定的成效,特别是农村信用社的存款业务有了长足的发展.各项存款逐年增加,截止2001年5月底止,各项存款余