基于机器学习的二手房估价模型

来源 :云南大学 | 被引量 : 0次 | 上传用户:sky_fly_sk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着房地产行业的迅速发展,近几年来购房热度逐渐飙升。住房关系人民的生活之本,而房价更关乎整个国民经济和人民生活的幸福感,因此住房价格逐渐成为社会关注的焦点问题。在现有的文献中,研究房价问题一般会采用传统的多元线性回归方法,该方法存在一个弊端是假设不同小区之间、小区与周围环境之间是互不影响的,其房屋估价的准确性很难得到保证。因此,本文在传统特征价格模型基础上加入空间效应,使用机器学习方法,建立一种更加科学准确的二手房估价模型。这种改良的空间特征价格模型能够帮助开发商更好地做出投资决策,为消费者购房时提供更准确的参考依据。本论文的主要内容包括:1、应用爬虫方法搜集了昆明市盘龙区132个小区的1060条数据,针对其中的缺失数据和脏数据进行预处理,将空间分异概念引入传统估价模型中,提出改进的空间特征价格模型。2、运用多种方法对收集的房价数据进行预测。首先介绍了所用方法的相关理论知识,用引入空间变量的最传统的方法—多元线性回归对数据进行分析,发现拟合度不高,F值很小。然后用XGboost和随机森林方法找到对小区单价影响较大的几个特征变量,10折交叉验证后,选出最优的参数。最后分别取70%为训练集,30%为测试集后,用支持向量回归、随机森林回归以及XGboost回归进行建模,得到单价的预测值。3、对比测试集房价预测值的误差和模型拟合优度,分析影响估价模型的主要因素并提出相关建议。结果表明,小区的位置、小区周围的交通条件(如距最近地铁站、公交车站的远近)、小区周围的教育环境(距最近学校的远近)以及房屋建造时间等对房价产生很大的影响。通过提取重要性较高的变量建模后,发现随机森林回归方法相对误差最低,XGboost回归模型拟合优度最高,即引入空间效应的随机森林回归模型和XGboost回归模型更适用于昆明市盘龙区二手房数据的研究。
其他文献
目的观察川芎嗪(LIG)对脂多糖(LPS)诱导的人冠状动脉内皮细胞(HCAEC)炎症损伤的影响并探讨其可能的机制。方法用1、10、100μmol/L LIG预处理HCAEC 12 h,再加入1 mg/L LPS共
随着建筑的大型化、异形化、智能化和建筑信息技术的快速发展,管线综合技术应运而生.推广和应用管线综合布置技术,可缩短施工工期,避免各专业交叉重叠造成的返工,提高施工质
对于二战时期日本军国主义在侵略亚洲战争中推行的军事性奴制度的揭露和幸存“慰安妇”的赔偿问题近年来一直是东南亚国家热门的研究话题,但是以受害国视角出版的英文译本还很少。二战时期日本军国主义在中国,尤其是在上海犯下的“慰安妇”罪行的具体情况在西方世界也鲜少提及。作为控诉日本军国主义战时罪行的又一力证,国家社科重大项目《证据:上海172个慰安所揭秘》一书的英译尤为重要。笔者在该纪实类图书的英译过程中,发
对煤矿企业而言,材料成本管理是其管理的重要内容之一,占有非常显要的位置,而且随着科学技术的发展,煤矿企业的机械化程度不断提高,企业在新工艺、新技术上的投入也将越来越
本文基于话轮转换策略,将《艾伦秀》中的商务访谈作为语料库,对节目中主持人和嘉宾使用策略的特点加以分析。经研究发现,在商务访谈中主持人和嘉宾惯用的话轮转换策略是不同
对湖泊野生日本沼虾和秀丽白虾群体的肌肉营养成分检测表明,虽然日本沼虾粗蛋白含量大于秀丽白虾(P〈0.05),但从氨基酸评价标准(氨基酸评分、化学评分和必需氨基酸指数)角度看,秀
<正>此前便已经在朋友圈中刷爆了存在感的微信小程序《小睡眠》在经过了一系列版本的推演与优化之后,终于在上周正式登陆APP应用商店,并且号称已经进化成为了"加强版",那么在
本文提出北华大学俄语专业零起点听力课教学中存在的部分问题:听力教材单一、选取难;师资力量薄弱;听力课程未受到相应重视;教法陈旧、墨守成规等。并从教学方法、教学内容、
以太行菊叶片、叶柄、茎尖和茎段为试材,采用MS培养基,在其中添加不同的激素对太行菊的不同外植体进行培养,研究了濒临灭绝的太行菊再生植株的方法。结果表明:太行菊的叶片、
2019年,面对更加错综复杂的国内外形势,中国经济在抵御下行压力中显现韧性,经济运行保持总体平稳、稳中有进的态势。2020年,世界经济和贸易增长乏力,不确定不稳定因素仍然较