论文部分内容阅读
伴随着互联网技术与智能设备的发展,各种移动应用出现并渗透到人们的生活,产生的信息也呈爆炸式增长。这使得人们难以高效地获取所需信息,同时企业难以将产品或者信息等精准地推送给用户。而推荐系统的基础是用户画像,高效地构建用户画像,将有利于企业实现精细化营销以及精准化推荐。然而,仅仅依靠传统的专家经验为用户画像贴标签效率低下,因此,基于算法模型的标签预测成为用户画像的研究热点。但是目前主流的浅层学习模型不能深入挖掘特征之间的复杂关系,尤其在面对高维稀疏特征时其预测效果仍有待提升。本文的研究目的是基于深度神经网络,从特征提取的角度对用户画像进行探索,并提出新的预测模型。本文通过对用户画像研究的梳理和总结,明确了其定义与构建流程,并指出了浅层学习方法在使用高维稀疏性数据建模时存在的问题。本文基于深度神经网络具有特征之间复杂关系挖掘的优势,提出将其与梯度提升决策树相结合用于用户画像的预测,其中,深度神经网络作为特征提取器,具有集成学习优势的梯度提升决策树作为分类器。同时,本文基于ID特征的现实意义说明其参与建模的必要性,并提出了使用离散化与独热编码对ID特征进行处理的方法。本文基于腾讯社交广告算法比赛的数据对用户转化率标签进行预测,实验结果表明,相较于浅层学习,深度神经网络模型在高维稀疏数据的特征学习上存在优势,作为特征提取器,能够提升浅层学习模型预测性能,其中本文提出的深度BP神经网络与梯度提升决策树的组合模型表现更好,AUC值达到了0.81,为用户画像的预测提供了新思路。此外,本文提出的ID特征的处理方法对其参与建模具有重要意义,并对用户画像预测模型的提升有显著效果。