论文部分内容阅读
“互联网+”的环境下,市场竞争愈加激烈,零售户的营销活动逐渐向消费终端延伸,终端零售户已经成为企业与消费者之间一个非常重要的中间点,直接关系到企业发展。同时,面对全国800万零售户产生的海量数据,如何挖掘潜在价值成为企业实现精准营销的关键。本文针对企业终端零售户数量庞大、分布广泛杂乱,难以直接从零售数据上挖掘出潜在兴趣并进行准确推荐等问题,研究了基于位置的推荐算法,最终引入针对消费能力和区域经济发展状况更具代表性的商圈作为分析单元,提出基于商圈的商品推荐算法。该方法能在一定程度上缓解冷启动问题,通过转变为以商圈为基础的市场推荐和投放模式,加强企业对市场环境变化的预判与掌控。论文的研究工作主要分为以下几个点:1)海量数据的采集与处理。通过终端采集、市场走访和系统填报等方式完成企业海量数据的采集,利用网络爬虫技术获取美团网中的商圈中心点数据和百度地图api中的POI兴趣点数据。针对海量数据问题,引入Spark分布式处理框架进行加工处理,完成数据的清洗、集成与转换,实现商圈兴趣点数据的预处理以及企业多源数据的整合。2)商圈兴趣点模型的建立。针对现有商圈测评模型中区域边界划分不稳定和地图api中商圈数据不完整的问题,结合目前较为流行的区域边界识别方法,以商圈中心点为圆心,以辐射距离为半径,对POI数据进行预分区得到初始商圈。然后利用所提出的基于分区的DBSCAN改进算法完成初始商圈内噪声点的剔除,以初始商圈为单位采用核密度估计方法确定Eps和MinPts参数值,通过POI数据的局部聚类,划定商圈区域范围,最终建立商圈兴趣点模型。3)基于商圈流行度的商品推荐算法。针对大数据环境下行业推荐精度不够、冷启动等问题,提出基于商圈兴趣点模型的商品推荐。通过分析零售户订单数据的特点,利用商圈兴趣点模型划分零售户数据到各个商圈内,实现点数据到面数据的转换。同时,考虑到消费者对商品的偏好时效性问题,结合时间衰减因子计算商圈内商品流行度权值,生成各商圈内基于商品流行度排序的推荐。4)基于商圈相似度的协同过滤算法。针对基于商圈流行度的商品推荐算法存在的惊喜度不足和长尾效应等问题,提出一种基于商圈相似度的协同过滤算法,考虑时间衰减因素为零售户推荐所在商圈的相似商圈中的热门商品。经实验对比结果表明,本文所提出的算法在推荐准确率上明显优于传统推荐算法,且缓解了冷启动问题,具有研究意义。5)基于商圈兴趣点模型的商品推荐系统的实现。为实现企业精准营销的需求,在推荐系统中融合商圈兴趣点模型,提出基于商圈流行度的热点推荐、基于商圈相似度的相关推荐以及新品投放策略。应用结果表明,本文所提出的推荐方法和新品投放策略具有不错的成效,提高企业整体销量,提升销售利润。