基于商品类目的个性化广告推荐

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:p2908892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网时代的到来,电子商务呈现爆发式的增长,越来越多的人通过网络购买自己心仪的商品。由于摆脱了传统货架空间的限制,像亚马逊、天猫、京东等B2C电商平台可以将海量的商品呈现给用户,满足人们日益增长的不同需求。然而,海量的商品同时也意味着艰难的选择,为了帮助用户快速的找到自己感兴趣的商品,帮助商家快速获取自己的目标用户,促进平台整体成交量的提升,推荐系统成为实现用户、商家和电商平台三方共赢的不二选择。  本文主要研究如何根据用户的需求实现个性化广告推荐的问题。针对现有的推荐系统存在的资源消耗过大、用户体验较差的问题,本文提出了一种基于商品类目的个性化广告推荐方案,该方案通过挖掘用户在购物网站上的点击日志,构建模型去预测用户近期的商品品类偏好,并以此为基础提供营销服务,满足了不同营销主体在不同场景的营销需求。利用阿里巴巴的真实电商数据,论文从特征构建和推荐模型优化两方面展开研究,给出了该推荐方案的系统原型。  特征构建过程首先对原始的用户点击日志进行了详细分析,合理的划分出了训练集、测试集和验证集;接着基于对数据和营销业务的理解,从用户、类目和用户类目对三个维度设计和构建了大量的原创性特征,全方位细化了用户和商品品类间的联系,大大减少了从原始数据到特征向量过程中的信息损失;最后借助 MapReduce并行计算框架,编写了大量的特征提取代码,完成了特征的流式提取,为后续的推荐模型构建与优化提供了良好的数据基础。  推荐模型优化研究首先以 XGBoost模型为基准模型,采用网格搜索和贪心策略相结合的超参数优化方案,获取了一个性能优异的推荐模型;接着针对特征数量较多,特征冗余明显的问题,提出了一种基于频繁特征对的特征选择算法,通过挖掘决策树从根节点到叶子节点的特征链路,获取频繁特征对,并以此度量特征重要性,实现了在保证模型分类性能前提下的快速降维,极大的减少了推荐模型训练、预测的计算资源消耗;最后,构建了一种多模型融合方案,将逻辑回归、极端随机树、随机森林、GBDT和XGBoost等模型的预测值作为特征,并结合特征选择算法获取的重要特征,再次使用 XGBoost算法构建复合模型,不仅在原来单模型的基础上进一步提升了分类性能,还大大增强了模型的泛化能力。
其他文献
随着基于光传送网(OTN)的智能光网络(ION)的应用和发展,未来光网络中将具有一个基于波分复用(WDM)的波长路由网络,承担起光层的选路和波长分配。在以WDM技术为基础智能光网络中,路由波
如何快速准确的实现车载定位是现代智能交通系统所要研究的一个重要问题。通常情况下,机动车的定位可以分为两个阶段。第一个阶段是初步定位阶段,即通过卫星或者无线网络采集车
H.264/AVC作为新一代的视频编码标准,不仅具有优异的压缩性能,而且拥有良好的网络亲和性,它被广泛应用在可视电话、高清电视、视频会议、视频监控等方面,但由于它采用了许多新技
量子Grover算法自1996年提出以来,以其优异的性能获得了广大学者的关注。但Grover搜索算法也存在诸如当目标态的数目占系统态数目的1/2时算法失效,当目标态的数目超过系统态数
SDN(软件定义网络)是一种新型的网络体系结构,将网络的控制能力从网络设备中解耦出来,实现与转发能力的分离,允许网络管理人员通过简单的编程就可调用底层的基础设施。SDN用
现有的量子遗传算法、量子蚁群算法、量子粒子群算法等量子群智能算法由于将量子计算和群智能算法结合,具有并行性、收敛速度快、种群多样性好、较强的全局搜索能力等优点。经
随着北斗卫星导航系统在军事和民用上越来越广泛的应用,人们对其的依赖程度也会越来越高。但是由于卫星信号自身的脆弱性以及干扰设备的简单易行性,使得其在传输的过程中容易
目前,采用LED照明进行植物光响应研究已经取得了一定的科研成果。但是,针对LED补光光源设计及其调控方式的研究还较少。多数LED植物补光灯按照固定比例使用红蓝光灯珠,并且只能
图像与视频信号是当今社会中最主要的信息载体,而最近兴起的压缩感知理论突破了传统奈奎斯特准则的限制,可以在对信号采样的同时实现信息的压缩,从而大大节省了信号的存储空
近年来,嵌入式系统在广泛的领域得到了大量的应用,同时以Internet为代表的互联网技术也正在飞速发展,把嵌入式技术和互联网络技术相结合产生了一种基于Web的嵌入式监控系统。这