基于不动产大数据的城市房屋数据分析与挖掘研究

来源 :南京林业大学 | 被引量 : 0次 | 上传用户:a226959
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国新型城镇化建设的不断推进,城市房屋规模爆发式增长,受城市资源配置及房屋供需失衡因素影响,全国各地特别是大城市住房矛盾逐渐呈现,房屋登记交易、房屋空置、房价问题已经成为关乎民生的重大问题,有效提升城市房屋精准化管理水平已成为当务之急。城市房屋精准化管理需要数据作为支撑,我国不动产统一登记已开展多年,实现了人、地、房数据的整合,虽然不动产登记成果不断增加,但是登记数据资源未能得到充分挖掘利用,因此亟需开展基于不动产大数据的城市房屋数据分析与挖掘技术研究,为国家和地方宏观调控城市房屋不动产资源、综合开发利用与可持续发展,提供强有力的科学依据及辅助决策服务。面向城市房屋不动产数据分析与挖掘的技术现状及社会需求,梳理城市房屋不动产大数据的概念及内容,以城市房屋不动产统一登记数据为基础,关联融合城市房屋使用过程中衍生的相关数据,构建城市房屋不动产大数据的数据库;面向不动产统一登记管理和国家宏观调控需求,从人、房、业务三个角度,对城市房屋不动产大数据进行统计分析;研究人房关系、房屋空置率、房价预测数据挖掘模型与算法,以X市城市房屋不动产数据数据分析与挖掘为例,开展城市房屋不动产数据描述性分析、预测性分析以及规范性分析,主要研究工作和结论如下:(1)城市房屋不动产大数据内涵及数据组织方法研究。首先梳理了城市房屋不动产大数据的内容,其次基于Kettle技术,处理了不动产统一登记数据库中的城市房屋登记数据,通过不动产单元号融合城市房屋使用衍生关联数据,利用Sqoop技术将数据加载到HBase数据库中,实现城市房屋不动产大数据的组织与存储,为开展城市房屋不动产大数据分析与挖掘建立数据基础。(2)城市房屋数据挖掘模型与算法研究。以城市房屋为研究对象,研究城市房屋分类并梳理城市房屋数据挖掘与分析的内容;基于城市房屋登记数据采用统计分析方法,对城市房屋现状及其登记业务进行描述性分析,利用基于规则分类法计算房屋空置率;基于主成分分析法对影响城市房屋价格的特征进行了降维分析,基于Lasso算法、Random Forest Regressor算法、XGBoost算法、Stacking算法分别构建二手房价格预测模型。(3)城市房屋登记数据统计分析与房价预测案例研究。以X市城市房屋不动产数据分析与挖掘为例,基于统计分析对该市城市房屋不动产统一登记数据进行多元化分析,包括但不限于权利人分析、城市房屋的类型、交易及抵押状况分析以及登记业务分析等;利用PCA对城市房屋价格的特征进行了降维处理,分别基于Lasso算法、Random Forest Regressor算法、XGBoost算法与Stacking算法构建该城市二手房价格预测模型并针对五个指标对模型预测精度对比。实证研究结果表明,在单个模型中,Random Forest Regressor模型的准确率明显优于其他两个模型;XGBoost模型的MAE、RMSE、RMSLE与绝对误差明显优于其他两个模型;Stacking融合模型的五种指标均优于单一模型,预测误差最小,能更加准确实现二手房价格的预测。
其他文献
随着科学技术的发展,新一代测序不断应用于lnc RNA转录本的鉴定与注释,成千上万的生物大数据席卷而来,越来越多的未知领域不断被揭示。然而,lnc RNA与m RNA的结构极其相似,且二者都具有生物学功能,这使得很难从众多转录本中识别lnc RNA。许多验证转录组的实验方法需要大量的时间和资源,各种传统的鉴定实验方法大多是耗时且昂贵的。大量研究表明,通过利用前沿的科学计算方法来识别这些转录序列是切
与传统的合成纤维相比,植物纤维具有来源广泛、绿色环保等优点,其天然形成的相互贯通的多孔结构使得声波更容易发生能量耗散,从而使其具有较好的吸声性能。声学超材料具有负质量密度及负体积模量特性,可以打破质量密度定律,使其在满足轻量化设计的同时具有较好的低频隔声性能。因此,针对由发动机舱经前围板传入乘客舱的宽频噪声,本文基于植物纤维和声学超材料,从吸声、隔声、减振三个方面开展了车内降噪研究,论文的主要研究
有效且低成本的避障功能是衡量仓储物流AGV安全性、经济性的重要指标。针对仓储物流AGV的低成本避障问题,本文提出了一种仓储物流AGV识障与避障软硬件方案,主要研究内容如下:(1)根据仓储环境特点,确定了仓储物流AGV的驱动方式;根据仓储物流AGV的加速时间、最大车速、最大载重等要求,确定了电机及驱动器进行选型;根据仓储物流AGV的续航要求,确定了电池选型;根据仓储物流AGV的避障要求,确定了传感器
在经济发展以及人民收入提高的社会背景下,旅游业进入高速发展阶段,随着人类活动范围和强度的不断扩大,势必会对生态环境产生一定的负面影响,一旦开发利用旅游资源,旅游区周围的环境就可能会受到破坏。大量研究表明,在旅游风景区中,植被与土壤承受着旅游活动带来的主要压力。因此,研究旅游干扰对景区植被与土壤的影响对保护生态环境具有重要意义。鉴于此,本研究选取在众多旅游干扰因素中最主要的人为践踏因素作为切入点,对
杨树是我国广泛栽培的树种之一,在工业用材、生态防护和绿化环境等方面具有不可替代的作用。杨树为多年生落叶乔木,在秋季形成驻芽以应对干燥寒冷的冬季,在春天温度和水分适宜的条件下,萌芽打破休眠后开始萌发,恢复生长。芽的休眠与萌发是杨树重要的生存策略,是对环境适应的综合体现,影响着杨树的地理分布和木材材积量。目前,有关杨树驻芽和萌芽时间的遗传机制还知之甚少。本研究以美洲黑杨(Populus deltoid
随着城市化进程的不断推进,高强度、高密度的城市开发使得历史文化遗产遭到急剧破坏并面临消亡的危险,城市历史景观的延续与传承面临着严峻的挑战。苏州地处太湖之滨,近郊群山林立,气候温和湿润,京杭运河横亘南北,经济发达,是我国首批国家历史文化名城之一。苏州古城的建置历史悠久,最早可以追溯至春秋战国时期。明清时期,苏州商品经济繁荣、手工业发展迅速,成为了江南地区经济文化的中心城市之一。同时,明清时期也是苏州
轮毂电机驱动电动汽车具有能量传递效率高、能够快速准确地获取驱动信息、传动结构简单等优点,为汽车系统动力学控制提供了新的平台。由于轮毂电机的转矩可以独立控制,通过控制同轴左右两侧车轮驱动转矩的不同就能够实现差动转向,因此轮毂电机驱动电动汽车的出现为四轮差动转向机制提供了可能性。目前差动转向系统可实现三种功能,即无需车轮侧向转动的滑动转向、辅助驾驶员转向以减轻驾驶员负荷的差动助力转向和作为容错机制以应
生产性景观是乡村中特有的一种区别于城市的地域性景观,不仅关乎农业农村的经济发展,而且其所传播的农业文化也是我国传统文化特色中不可分割的一部分,具有传承价值。然而随着城乡一体化建设的发展,乡村中的农业用地面积逐渐减少,生产性景观得不到应有的重视。因此本文通过对南京地区32个美丽乡村的调研,探索南京市乡村生产性景观发展现状。通过深入挖掘其景观模式,建立全面的评价体系,根据评价结果提出针对性的景观提升策
青梅含有人体代谢不可缺少的柠檬酸等多种天然酸,为目前已发现的罕见碱性林果。青梅含有丰富的氨基酸、脂类、无机盐、维生素和微量元素,具有很高的营养价值和药用价值,对人体蛋白质组成和正常代谢十分有益,对普遍存在的心血管、泌尿、消化系统疾病有明显的预防作用和疗效。在梅果的实际生产中,原料青梅果的成分通常是依靠工人的经验来控制的,即通过采摘时间进行成分的管理控制。一般来说,七成熟采摘的梅果用于生产青梅精,八
掌握区域土地资源状况,因地制宜的采取有效防治措施,对合理开发和可持续利用土地资源,维护生态环境稳定,促进社会经济高质量发展具有重要的意义。受自然因素和社会经济因素等影响,土地利用在空间分布上具有空间自相关性和空间变异性,而传统的土地利用抽样调查方法没有考虑这种空间特征,在样本设计和总体估计上存在缺陷。随着遥感技术的发展,将遥感影像与空间自相关理论相结合的空间抽样方法已被多个国家广泛应用在了土地利用