基于机器学习的二手车价格预测

来源 :云南大学 | 被引量 : 0次 | 上传用户:jinghong_22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪以来,我国经济社会进入了快速发展阶段,人们的物质生活水平有了显著提高且对于精神生活的需求日益增加,从而使得近年来二手汽车行业也呈现了较高的发展速度。但是随着二手车市场规模发展越来越大,一系列价格评估体系问题也相继浮现,其中主要以估价的主观性问题为主,这些问题的产生对二手车价格的合理评估形成了较大影响,更对二手车市场的长久发展造成了严重制约。因此,寻找更加规范、合理的二手车价格预测系统具有一定的现实意义。本文采用某电商交易平台产生的二手车数据,应用机器学习方法开展二手车价格预测的统计分析研究。考虑将数据的原始变量及其衍生变量纳入到二手车价格预测模型中,应用LASSO回归模型、XGBoost算法和LightGBM算法建立三种二手车价格预测模型。采用平均绝对误差作为评价指标对三个模型的预测效果进行系统对比分析,我们发现:LightGBM算法的效果最佳,平均绝对误差最小,运行时间最快,且从学习速率曲线看,该模型在训练集和交叉验证集的准确率都收敛,预测能力和泛化能力都比较好;XGBoost算法的表现略弱于LightGBM模型,平均绝对误差比LightGBM大0.008;表现最差的是LASSO回归模型。研究结果表明:影响二手车价格的前三个重要性因素按先后顺序依次为匿名变量、衍生变量二手车使用天数、汽车的功率,而与常识相符合的因素比如燃油类型、车身类型等却位于重要性排名的末尾,验证了构造衍生特征变量的合理性。本文建立的价格评估模型可为消费者评估二手车价格提供一种适用性更广的方法,如针对不同的汽车品牌、发动机功率以及使用天数,根据二手车的交易记录数据即可进行价格评估。本文基于某电商平台提供的二手车交易数据建立的价格预测方法也适用于线下的二手汽车交易情况。
其他文献
十九大报告指出:“人与自然和谐共生,必须树立和践行绿水青山就是金山银山的理念。”报告强调了经济发展与环境保护同等重要的地位。近几年来,我国大力发展城镇化。1978年,我国城镇化率仅仅为17.92%,远远低于现代化发展要求的水平。但是2019年我国城镇化率增加到了60.60%,增长幅度超过了42%,年均增长幅度约为1%。城镇化以较快的速度增长。但是在城镇化取得进步的同时,生态环境也开始受到破坏。生活
学位
随着信息技术的发展和通信设备的普及,中国网民规模、互联网普及率达到了较高的水平,这也给社交媒体的稳步发展提供了良好的基础。现如今网络环境中,微博已经成为重要的社交媒体之一。在这种背景下,使得谣言的滋生也越来越多,因此谣言治理的问题也逐渐成为研究的重点。当前,对于网络信息的老化研究较多关注于网络学术信息的老化问题,而对于谣言信息的研究相对较少。因此本文运用药物动力学中血药浓度扩散原理对微博谣言的老化
学位
采用一体化设备MBBR工艺对重庆市某餐厨垃圾处理厂低浓度废水进行处理,系统介绍了一体化设备工艺、分区设计、受力分析、流态模拟,并通过该设备从调试运行到连续稳定运行的水质变化情况,分析系统处理效果。结果表明,该一体化设备最大应力值为58.248 MPa,强度校核评定结果安全,且流态模拟显示污泥沉降功能良好、汽水混合效果好。COD去除率达90%,氨氮去除率达90%,TN去除率达70%,SS去除率达95
期刊
随着信息科技的迅速发展,函数型数据成为目前较为重要和流行的一类数据。函数型回归建模是分析函数型数据的重要工具,一直受到广大学者的关注。其中半参数回归模型结合了参数回归模型和非参数回归模型的优点,是近年来统计学者研究的热点。本文研究对象是把函数型线性模型和单指标模型结合起来的半参数函数型线性模型,即单指标部分函数型线性回归模型,它结合了参数模型和非参数模型的优点,因此本文所研究的模型具有更广泛的应用
学位
中国居民消费价格指数对价格水平监控、经济分析决策、调控国民收入有着重要作用。尽管国内也有相关文献对其做出分析,但却很少有人利用空间计量模型进行研究,这导致各省份间,消费差异的相关性无法体现。本文首先对我国31个省份2009—2019年的32个相关价格指数数据采用LASSO、自适应LASSO、Bridge三种惩罚方法进行变量选择。在选出10个对居民消费价格指数有重要影响的因素后,文章从空间计量分析的
学位
目的:放射治疗是食管癌的一种有效治疗方法,食管瘘是食管癌放疗期间最为严重的并发症,食管与邻近的组织和器官形成食管瘘后有较高的死亡率。本研究旨在探讨口服泛影葡胺食管造影在食管癌放疗期间筛查食道瘘的灵敏度和特异性,并探讨早期发现和治疗食管瘘是否能改善其预后。方法:根据入组标准,对经病理证实的Ⅰ-Ⅳ期食管癌患者进行放射治疗。放疗期间每周口服泛影葡胺食管造影,如发生食管瘘,则用纤维食管镜或计算机断层扫描(
学位
线性互补问题是数值代数研究的重要课题之一,在力学、经济学、工程、交通等许多领域都有着广泛的应用.本学位论文研究了线性互补问题()的数值解法.对于,首先将其转化为一个求解非线性方程组的问题,再将求解算子方程的7)8)算法与文[Xu W,Liu H.A modified general modulus-based matrix splitting method for linear complemen
学位
近年来,时变参数(Time-varying parameter,TVP)模型在经济学领域非常流行,因为该模型能轻易的捕捉随着时间变化的信息,且灵活易懂,具有很强的可解释性。但是,这种灵活性是有代价的,一方面,TVP模型可能会被过度参数化。特别是,当潜在的解释变量特别大时,模型可能遇到“维数祸根”问题,导致样本内预测效果好,但样本外预测效果差。另一方面,对那些本身并不存在时变性的参数进行时变性设定,
学位
乡村治理的成果对乡村振兴的推进和国家治理现代化的实现有着深远的影响。当前,乡村治理已经走入了新时期,需要提升政府的治理能力,这给乡镇政府职能要求带来了一定的变化,如服务能力的提升、科学民主行政的实现等。政府职能变化也对乡镇公务员的素质提出了新的要求。因此,提升乡镇公务员素质能够促进治理能力的提升。自农村社会转型的以来,我国更加注重乡镇公务员素质的提升,2014年发布的《关于加强乡镇干部队伍建设的若
学位
本文讨论了平行机等级排序问题和图均衡问题.平行机等级排序问题简单描述如下:给定机器集合M={M1,M2,…,Mm},工件集合J={J1,J2,…,Jn},工件一个接一个到达,且不允许抢占,工件和机器均有q个等级,对于任意等级为l(1≤l≤q)的工件只能在机器集合M={M1,M2,…,Mm}的特定子集Ωl (?) M上进行加工,即只有当工件等级不小于机器等级时,工件才允许在该台机器上加工.目标是找到
学位