基于自适应密度聚类和XGBoost的共享房源价格预测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:jiajiawangwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,共享房源行业的大规模发展带来了房源数量的激增,在竞争日益激烈的市场环境下,房东可能无法准确地自主定价。为确保房东以及平台的收益,合理预测共享房源平台中海量房屋的租金价格成为重要的研究问题。然而,共享房源的个性化程度较高,并不能直接参照酒店行业选取房源特征,为解决共享房源价格预测问题带来了巨大挑战。因此,为帮助房东提高自主定价的准确性,本文在构建共享房源价格影响因素模型的基础上,提出了一种基于自适应密度聚类和XGBoost的共享房源价格预测方法。首先,基于对相关文献的整理归纳,本文论证了共享情境下房源价格影响因素与传统酒店行业的不同,从房东、房型、设施服务、租赁规则、地理位置、评分六个维度重新界定共享房源特征,构建价格影响因素模型,在此基础上实现共享房源价格预测。其次,为使价格预测效果得到进一步提升,本文将改进的自适应密度聚类方法与机器学习预测模型相结合,一方面,改进的自适应密度聚类方法能够克服在高维数据中识别真实密度聚类中心的困难,降低人工设置参数的干扰,挖掘在特征上具有相似表现的房源子集,梳理共享房源数据,简化房源价格预测场景;另一方面,根据得到的房源类簇,分类别采用XGBoost机器学习模型提高房源价格预测的准确性,并通过分析不同房源类簇的特征重要性为预测价格提供一定的可解释性。最后,利用美团民宿平台中的真实房源数据进行实验验证。实验结果表明,本文在密度聚类方法上作出的改进是正确的,能够在共享房源数据中有效识别真实聚类中心,并在聚类效果上优于其他方法;与未聚类的房源价格预测相比,基于自适应密度聚类和XGBoost的预测方法,能够有效提高价格预测的准确性;同时,与其他机器学习模型相比,XGBoost模型的表现更出色。本文基于构建的价格影响因素模型,将自适应密度聚类方法与共享房源价格预测方法相结合,不仅扩展了聚类方法在共享房源研究领域的适用范围,还为解决共享房源价格预测问题提供了一种新思路,有效缓解了共享房源房东和平台的定价困扰。
其他文献
近年来,我国社交电商平台发展迅猛,其中短视频营销功不可没。由于其沟通方便,互动性强,这一营销方式受到越来越多的用户的青睐。作为短视频管理的平台方,如何判断视频内容对用户是否“有用”是其亟待解决的问题之一,因为“有用”的视频是平台进行精准推荐的重要依据。当前大量的研究聚焦于在线评论的文本有用性和图片有用性上,鲜有针对短视频有用性的研究。鉴于此,本文以社交电商平台中的短视频为研究对象,基于信息采纳模型
学位
阿罗-德布鲁一般均衡模型对于一般均衡存在性、稳定性的证明上能够提供严谨的逻辑证明,但该模型的假设过于理想化,与现实的经济系统运行状况存在偏差,SMD(Sonnenschein-Mantel-Debreu)理论的出现有力的证明了这一观点。学者们认为阿罗-德布鲁一般均衡模型在解释现实经济系统时的不足体现在对于消费者偏好理论的假定。反对者认为模型为了使消费者效用函数满足优良的性质,对消费者偏好进行了脱离
学位
在线医疗社区的出现有利于缓解我国医疗资源紧缺和地区分布不均的问题,当下政策支持、现实需要、公民认可让在线医疗社区在未来的蓬勃发展成为了必然。但是由于患者缺乏专业的医学知识,难以辨别医生的专业水平和服务态度,导致患者择医困难、线上就医意愿较低,医患信息不对称阻碍着社区健康持续发展。在线医疗社区的发展与患者的参与息息相关,患者就诊之后留下的就医评论为其他患者提供了了解医生医疗水平的新渠道,有助于提升患
学位
当前,我国对生态环境保护的重视程度可谓是空前之大,陆续颁布的政策文件和法律法规使得整个社会都将目光投射到环境保护上来。企业作为推动经济发展的主体,成为了解决环境问题的重要力量,且在此过程中衍生出了不同形式的环境实践。在学术界,虽然学者们已经认可了绿色供应链管理是企业推动环境治理的有效手段,并进一步探究了影响绿色实践的因素,但是现有研究多基于单一层面或单一因素展开,且对供应链层面差异化环境实践的研究
学位
在日益繁荣的互联网社会中,网络霸凌成为了一种新型的社会问题。虽然网络霸凌发生在不同的在线渠道和平台上,但社交媒体成为了网络霸凌的重灾区。社交媒体代表了一种新式的集成通信平台,具有匿名性、开放性、即时性等特征,这也使得社交媒体的社交环境更容易发生网络霸凌,并且霸凌行为带来的伤害往往也更加严重。由于多重角色扮演以及社交互动中不一致的角色期待,社交媒体用户经常会出现角色冲突现象。此外,一些社交媒体用户往
学位
随着社会经济和科技水平的不断发展,人们在日常生活中产生的垃圾越来越多,将这些垃圾进行分类存放和处理,对于可回收资源的再利用和保护自然环境来说具有重要意义。但是由于很多居民对于垃圾分类相关知识的缺乏,导致目前垃圾在源头分类的准确率和效率并不高。近年来,卷积神经网络的飞速发展,使借助深度学习技术实现垃圾的智能分类具有了现实的可能性。如果将垃圾图像分类模型嵌入到分类垃圾桶中,通过识别垃圾图像来辅助居民进
学位
群体决策广泛存在于人类社会的经济、政治、文化等领域,已成为人类日常活动之一。由于决策环境的不确定性及人类认知的模糊性,在群体决策问题中,决策者越来越倾向于使用语言术语来表达其观点,即语言型群体决策问题。在语言型群体决策问题中,不同的决策者对同一个语言术语可能有着不同的理解,即个性化语义。对决策者的个性化语义进行建模能够得到更合理更符合实际的决策结果。在考虑个性化语义的语言型群体决策问题中,群体共识
学位
随着在线医疗社区的不断发展,医患的可持续互动对于优化医疗资源分布、改善医患关系和帮助患者管理疾病等方面具有重要意义。患者参与在线医疗社区可以获得来自医生的社会支持,同时他们也可以给予医生经济回报与社会回报。医患持续互动作为在线医疗社区社会交换的重要过程,目前学者们主要进行了影响医生经济回报的相关研究,较少有研究关注影响医生社会回报的因素。同时从医患互动的角度出发,探究医生的在线社会支持对患者提供给
学位
数据的开放与资源的共享已经成为信息时代最大的特点之一。随着行业间数据壁垒的逐渐消失,跨领域推荐受到了越来越多的关注。跨领域推荐与单一领域推荐不同,单一领域的数据相对而言同质化程度更深,而跨领域推荐意味着可以利用数量更多、内容更多元的数据进行模型训练,从而提升模型的推荐效果。传统的跨领域推荐利用信息更加丰富的源域辅助目标域学习,提升目标域推荐效果。然而,这种跨领域推荐将关注点集中于目标域,无法逆向为
学位
随着互联网+模式的发展,众包已在诸多领域得以应用。众包平台中的接包方是由不同的技能水平和社会背景组成,因此提交的任务结果不尽相同。目前国内现有平台尚未建立对接包方的客观全面的评价体系,同时对发包方和众包平台也缺少必要的参考依据,如何对接包方进行信誉评价成为众包领域下相关研究的热点。本文总结了大量的国内外研究文献,介绍了众包模式及信誉的相关研究工作,分析了现有众包中信誉评价工作的优缺点。通过对众包平
学位