论文部分内容阅读
广告的推广、商品的买卖是电商、社交、搜索等诸多类型互联网科技公司主要的经济来源。商品、广告的划分以及用户的点击行为预测,可以帮助企业解决商品、广告的推荐问题。 商品、广告的划分,现阶段面临诸多问题,例如商品根据颜色和大小等不同规则划分的结果完全不同,且现阶段无论是人工划分方法还是机器划分的方法都需要投入一定人工。本论文利用短时间共现商品具有相似性的特点,从历史数据中提取共现特征,为避免高维特征的“维度爆炸”问题利用自编码器进行特征损失较小的降维处理,最后利用无监督聚类方法对降维特征进行聚类得到商品的划分。这种基于共现的商品划分方法可以解决商品划分标准不统一、划分规则不明确时无法划分、划分过程的人工成本的问题。本论文针对DBSCAN和K-Means两种聚类算法进行实际数据的划分效果验证,并对K-Means的算法缺陷问题k值选取提出一种根据不同评价指标的实验结果选取k值的方法。 用户点击行为预测是一种直接变现技术手段,很小的效果提升就会产生很高的经济价值。通常各个企业针对用户的点击行为预测都是从点击率预估入手,并且常常忽略了用户点击行为的时序性。本论文提出基于时序特征的用户点击行为预测模型,根据用户点击、购买行为的时序特点和前后依赖关系,利用循环神经网络捕获用户的时序兴趣特征用于预测用户的接下来的点击行为,进而缩小推荐范围,达到提升经济价值的作用。此外本论文利用长短时记忆模型、门循环神经单元和注意力机制对模型进行效果优化,并针对注意力机制的获取上提出三种与前人不同的获取方式。通过大量实验对比验证基于时序特征的用户点击行为预测系列模型效果突出,明显领先于其他模型。