论文部分内容阅读
我国房地产业在实行土地招拍挂制度后迅速发展,为中国经济的增长做出了重要贡献。在房价不断上涨的背景下,分析和预测房地产市场的发展趋势,对消费者、开发商和政府来说都具有重要意义。传统的社会经济预测研究采用的数据多为国家或地区宏观经济数据,具有一定的有限性和时滞性;而将网络搜索引擎用户的大数据用来研究消费者的搜索行为与住宅价格和成交量之间的相关关系、探索和预测房地产市场表现的规律和趋势,则是身处信息时代的有效研究方法。本文的研究对象是广州和深圳的新建商品住宅,将百度指数中的搜索关键词数据进行处理,作为自变量;将国家统计局和经济数据库的住宅销售价格和销售面积同比指数进行整理,作为因变量;时间跨度为2011年1月至2018年12月共96个月。本文首先总结了我国房地产发展和调控政策的概况,并阐述了网络搜索及关键词的原理和意义,从而分类梳理房地产市场的影响因素并以市场供求关系理论为核心构建理论框架。本文运用文献研究法、经验取词法进行关键词的初选,得到7个初始关键词;运用二次搜索、长尾挖掘等文本挖掘方法进行关键词的扩展,得到139个扩展关键词;通过Matlab对百度指数搜索量趋势图进行图像识别和海量数据处理,运用时差相关性分析法进行关键词的筛选,得到包含时间序列信息的筛选关键词。接着借助Eviews10对关键词数据进行ADF平稳性检验、Granger因果关系检验和协整检验,继而用SPSS22.0进行主成分分析,通过构建多元线性回归模型来拟合变量之间的相关性,并验证了模型的实用性。本文运用随机森林模型进行因变量的预测,拟合优度较高,说明网络搜索关键词指数与住宅市场指数之间具有较强的相关性,根据网络搜索数据来预测住宅价格和成交量的可行性较高;继而对广州和深圳的商品住宅市场和城市特征进行了相关性分析,以城市视角对关键词数据与住宅市场的相关性做出解释。本文发现,销售面积与网络搜索指数的相关性比住宅价格与网络搜索指数的相关性更强,且不同城市与住宅市场相关的网络搜索关键词及相关性程度存在差异。本文搭建了从城市发展角度对网络搜索数据和住宅市场相关性的解释性逻辑框架并进行了实证研究,为有关中国房地产区域化差异的研究提供了新的视角和一定的借鉴。