基于机器学习的苏州市二手房价格评估模型研究

来源 :南京审计大学 | 被引量 : 0次 | 上传用户:sysylh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
改革开放以来,我国经济得到了快速发展,房地产产业也得到迅速发展,国家统计局2020年数据显示,房地产行业投资占GDP比例是7.2%,房地产行业在国民经济中具有重要地位。二手房价格对房地产业发展具有重要影响,也对居民的消费、生活满意度等具有重要影响。不同城市间经济结构、居民收入、居民消费等都具有不同的特征。当前针对对北京、上海等一线城市以及部分省会城市二手房价格研究较多,而对于非省会的一部分“新一线”城市二手房价格几乎没有研究。本文选取江苏省苏州市二手房价格为研究对象,通过对苏州市二手房价格预测的实证研究,探索适合“新一线”城市二手房价格预测的方法和模型。本文通过爬虫软件对安居客网站上的苏州市二手房房源进行采集,经数据清洗后,对二手房标题字段进行词云图分析,得出高频出现词语:楼层、急售、精装修、三房、南北、通透等信息,同时对数据集进行初步探索性分析,得出影响房价的重要特征。针对特征工程后的数据,本文利用K近邻、支持向量机、随机森林回归、Xgboost、LightGBM、BP神经网络等模型进行研究分析,确定随机森林回归、Xgboost、LightGBM为最终的三个基模型,最终基于随机森林回归、Xgboost、LightGBM模型,结合Stacking融合方法,构建了融合随机森林回归、Xgboost、LightGBM模型的Stacking融合预测二手房房价模型。实证结果表明,本文融合随机森林回归、Xgboost、LightGBM模型的Stacking融合预测二手房房价模型,其预测精度最高,其MAPE指标为2.51%。利用LightGBM模型分析了影响二手房房价的重要因素,结果显示房屋属性和小区属性是当前二手房房价的重要决定因素。本文还针对购房者、房产中介人员、相关政府部门提出相应的建议。
其他文献
自改革开放以来,我国凭借人口红利带来的劳动力成本优势和丰富的土地资源,低端嵌入全球价值链,取得了傲人的经济成就。但随着新冠肺炎和贸易保护主义的不断加剧,经济全球化受到严重冲击,我国产业全球价值链攀升脚步受阻。当今世界正处于巨变中,经济增长驱动由要素驱动、投资驱动,转变为创新驱动。创新是引领高质量发展的第一动力,各国纷纷制定了创新生态系统发展战略,在外部不确定性冲击和内部不稳定因素的影响下,提升创新
学位
传统的物理试验存在输入因子少,随机噪声干扰强,需要耗费大量的资金并且往往无法在现实生活中进行试验等缺点。为了克服物理试验的诸多缺点,计算机试验应运而生。计算机试验中通常包含大量的输入变量,然而当基变量的数量过多时会造成模型过拟合且降低预测精度。因此,通过变量选择的方法来建立一个有良好预测能力且形式简单的元模型变得至关重要。本文主要研究了贝叶斯框架下Universial Kriging模型均值函数的
学位
股票市场作为市场经济的晴雨表,在资金流通和优化资源配置等方面起着重要作用,在市场经济的发展中占据着举足轻重的地位。在我国,股票市场也是企业投融资和居民理财的重要选择,尤其近期随着房地产市场情况发生较大变化,作为我国居民金融资产重要组成部分的房产的价格增速进一步降低,导致越来越多的资金从房地产市场直接或间接地流入到股票市场中,使得股票市场在我国市场经济中的作用更加明显、地位更加重要。而资本资产定价模
学位
近年来,大数据应用的发展给许多行业带来了巨大的生机,随之而来会出现更多更复杂的问题。而有些试验并不能大量重复进行,所以可以通过计算机试验来模拟试验中的一些物理过程有效地帮助解决上述问题。在计算机试验元建模中,Gaussian Kriging模型是一种非常重要的模型,它的预测是最佳线性无偏预测,同时,它能够度量预测的不确定性。如何进一步提高该模型预测精度并实现快速建模是许多研究者都在关注的问题。论文
学位
当前,我国经济形势进入新常态,处于增长动能转换的关键时期,产业转型升级的需要日益迫切。与此同时,“一带一路”建设正如火如荼。作为我国新时期“走出去”战略的重大工程,“一带一路”倡议紧密地联系了我国同沿线各国的关系,有力的拉动了我国的对外贸易和对外投资,同时对我国的技术发展产生了积极影响。验证“一带一路”倡议对我国产业升级的影响并且探求其中的作用机理,对我国推动经济高质量发展有重要的理论意义和政策意
学位
中国经济快速增长的同时,能源消耗也不断增加,碳排放量急剧上升。电力行业作为我国碳排放量最多的行业,其碳减排效果对实现碳达峰和碳中和目标至关重要。同时,在数字经济时代下,数字化技术从信息技术产业广泛渗透到能源消费和环境保护领域,具有改善生态环境的巨大潜力。探索数字经济对节能减排的贡献有利于实现“经济发展-环境优化”的共赢。本文在借鉴数字经济与碳排放相关文献的基础上,从以下几个方面进行研究和分析:第一
学位
股指期货是以股票指数作为标的的金融期货产品,是我国金融市场重要的产品,股指期货双向交易的特点为投资者提供了更大的操作空间,且股指期货采用交易保证金制度,提供了巨大杠杆,投资者通过杠杆操作更多资金。金融序列预测一直是量化市场研究讨论的主题,但是金融序列存在高噪声、非线性的特点,导致其预测研究并不容易,预测滞后问题很大程度阻碍着策略构建,且单纯依靠模型结果建立的策略存在模型可能失效的问题。在众多国外成
学位
近年来,机器学习理论在互联网科技公司的应用发展迅速,推荐算法、语音识别、自动驾驶等都是基于机器学习和深度学习的应用。数据量爆炸式增长推动机器学习模型的发展。保险行业是一个基于数据的行业,保险产品价格是通过分析风险事故主客体数据来确定。保险行业拥有高质量的规范数据,但是由于机器学习模型可解释性差的缺点,其在保险行业应用不够充分。数据建模在保险行业的应用主要包括三个方向:识别保险欺诈、保险公司运营和保
学位
金融资产收益与波动,一直都是金融领域关注的焦点。进入“十四五”规划的第二年,在这新的发展阶段,为了稳定大局,我国正在落实积极且稳健的宏观政策。总体上国内新冠疫情得到较好控制,但是当前国际环境依然严峻、局部地区疫情反复,整体经济大环境存在诸多不稳定因素。所以,对金融市场保持关注与研究是十分必要的。在过去的研究中,由于宏观经济数据频率通常为月度、年度这一限制,与日度类股票市场等的金融数据不同频率,在研
学位
近些年来,我国互联网技术飞速地发展。电子商务平台借助于这一股东风也迅速成长,逐渐成为拉动我国的消费水平,帮助传统企业进行改革与升级,实现脱胎换骨,发展现代化服务行业的一个重要核心组成部分。所有人生活最简单的方式都发生了翻天覆地的变化。本文采用和鲸社区大数据竞赛平台所提供的亚马逊平台电子产品销售数据,这是已经经过脱敏处理的真实交易数据,对消费者的行为进行统计分析,对交易价格进行挖掘预测,预测未售出产
学位