分布式下二手汽车关注程度的分析与预测

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:wukeda139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘系统,是人工智能研究领域的热点问题之一。网站数据挖掘,作为数据挖掘的一个具体应用,在商业智能中具有非常广泛的应用,以人工智能和大数据技术为基础,能够对以往积累下来的数据加以分析,在转化为能够帮助企业提升企业运营和管理方面知识的同时,也能够挖掘潜在客户以及作预测未来发展方向等。简单来说,在商业智能领域中,网站数据挖掘就是一种能够为企业在生产和管理、运营和销售作出调整和优化决策的有效手段,其意义在于能够为企业带来更多的经济价值以及提高企业竞争力。在大型网站中存在着大量的网页,同时网页中存在着大量复杂的数据,因此获取这些数据并且存储下来是数据挖掘的关键。本文利用大数据环境下的分布式爬虫框架Scrapy-Redis对二手汽车网站的数据进行爬取,将数据存储到广泛应用的分布式系统Hadoop的小型集群中,然后对数据进行特定预处理操作并对数据进行分析,最后采用K-Means+RBF神经网络对用户关注程度进行预测。车辆的关注程度,可以反映车辆在当前二手汽车市场中的受欢迎或关注的程度,企业可以根据车辆的关注程度,进行线上网站运营做优化策略调整,提高网站的受欢迎性。为了更有效的、直观地进行车辆关注程度预测本论文采用K-Means无监督聚类算法对数据进行分类并使用多层感知网络RBF神经网络进行训练学习,通过RBF神经网络模型对车辆关注程度进行预测,最后通过实验验证了该算法的可行性和准确性。
其他文献
因为当前社会人口数量的逐渐增加,人均土地资源的占有率逐渐减少,因此,提升土地的运用率,达到人们对于房屋建筑的需求,是国内房屋建筑领域的发展目标。目前房建项目正在想高
<正>多年来,我养成一个习惯,不仅阅读音乐教育与音乐专业类的书籍,还喜欢阅读其它学科的书籍,所以很早就知道语文教坛上著名的薛瑞萍与窦桂梅老师。而第一次知道窦桂梅老师,
近几年,基建投资活动在我国许多地方大量兴起,建筑施工投资项目各式各样.这时,建筑施工成本的管控就显得十分重要.当前建筑施工方广泛使用的成本控制法有很多问题与漏洞,如施
二仙汤加葛根、淮小麦、炙甘草、百合、煅牡蛎、大枣治疗妇女围绝经期综合征60例,总有效率90.5%,提示本方有温肾助阳、滋阴宁神、调和阴阳的作用,具有促进卵巢功能和改善雌激
山东泰山抽水蓄能电站上库挡水坝采用钢筋混凝土面板堆石坝,库盆防渗型式选择钢筋混凝土面板与高密度聚乙烯土工膜及垂直防渗相结合的综合防渗方案。周边缝的稳定与否决定了
目的探讨老年高血压病的特点,提高老年高血压病患者的护理质量。方法对60例老年高血压病住院患者实施饮食指导、病情观察、心理疏导和健康宣教及出院指导,观察护理效果。结果
从古至今,女性参与体育的过程从一个侧面向我们展示了社会发展和人类文明的进程。特别是进入当代社会,体育已经成为女性物质、精神生活的一部分,成为她们全面发展的一种象征,
以工程为背景,从了解振源入手,研究了振源以及传播途径,通过数值模拟计算,分析了设备基础振动的研究方法,模拟了动力设备基础、地基体系的动力响应,可得,通过有限元方法对垂直振动、