基于商品共现聚类及时序特征的点击预测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:surezheng12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广告的推广、商品的买卖是电商、社交、搜索等诸多类型互联网科技公司主要的经济来源。商品、广告的划分以及用户的点击行为预测,可以帮助企业解决商品、广告的推荐问题。  商品、广告的划分,现阶段面临诸多问题,例如商品根据颜色和大小等不同规则划分的结果完全不同,且现阶段无论是人工划分方法还是机器划分的方法都需要投入一定人工。本论文利用短时间共现商品具有相似性的特点,从历史数据中提取共现特征,为避免高维特征的“维度爆炸”问题利用自编码器进行特征损失较小的降维处理,最后利用无监督聚类方法对降维特征进行聚类得到商品的划分。这种基于共现的商品划分方法可以解决商品划分标准不统一、划分规则不明确时无法划分、划分过程的人工成本的问题。本论文针对DBSCAN和K-Means两种聚类算法进行实际数据的划分效果验证,并对K-Means的算法缺陷问题k值选取提出一种根据不同评价指标的实验结果选取k值的方法。  用户点击行为预测是一种直接变现技术手段,很小的效果提升就会产生很高的经济价值。通常各个企业针对用户的点击行为预测都是从点击率预估入手,并且常常忽略了用户点击行为的时序性。本论文提出基于时序特征的用户点击行为预测模型,根据用户点击、购买行为的时序特点和前后依赖关系,利用循环神经网络捕获用户的时序兴趣特征用于预测用户的接下来的点击行为,进而缩小推荐范围,达到提升经济价值的作用。此外本论文利用长短时记忆模型、门循环神经单元和注意力机制对模型进行效果优化,并针对注意力机制的获取上提出三种与前人不同的获取方式。通过大量实验对比验证基于时序特征的用户点击行为预测系列模型效果突出,明显领先于其他模型。
其他文献
随着各种智能卡的技术不断发展、成熟,应用领域不断增加,人们随身携带的智能卡越来越多,如果将多个应用能集中到一张卡上,即“多应用智能卡”,将给人们提供更多的便利,有着广阔的发
机器学习是研究计算机系统如何根据以往经验来改善自身性能的学科,是目前计算机科学中最活跃的学科分支之一。很多机器学习方法的性能都与距离度量密切相关,因此近年来距离度量
随着时代的发展,互联网上的信息正在以指数级的速度增长。人们在享受互联网发展带来的各种方便的同时,也出现了如何在如此海量的内容中准确、快速的定位到自己所需要、有价值的
近年以来,以物联网技术为依托的智能家居服务受到了越来越多的广泛应用。不仅可以提供信息交流的途径,还可以培养人们良好的生活习惯,有效的节约时间与资源。在智能家居中,用户是
随着信息技术的飞速发展,一方面,人们的生活与计算机信息技术越来越息息相关,大量的数据信息被存储于计算机中,并通过网络进行着传输。另一方面,网络的安全也备受人们的关注,如何提
近年来,并行计算技术获得了充分的发展,各种新的软硬件层出不穷。图形处理器(GPU)作为一种高度并行化的处理器架构,已得到越来越多的重视,目前已诞生了以NVIDIA CUDA(Compute Uni
随着Internet的广泛普及,对等网络很快成为研究和应用的一个热点,其P2P覆盖网的构建得到了极大关注和重视。结构化P2P覆盖网中,资源的分布具有一定的映射规律,但在利用分布式
学位
在互联网高速发展的今天,网络应用早已不局限于传统的网页浏览,电子邮件等,文件共享的地位越来越重要,而传统的C/S模式无法满足用户对于速率的需求,因此P2P逐步成为最重要的文件共
随着多媒体技术的发展和移动设备的普及,人们开始通过手机等设备浏览图像和视频,面向移动设备的视觉媒体应用逐步成为新的消费时尚。与面向电视、电脑等传统展示设备的视觉媒体
近年来,随着Agent技术、理论、应用等方面研究的不断深入,越来越多的工业和商用等应用领域开始采用Agent的方式进行软件系统的构造。其中Agent通信语言(ACL)作为充分发挥Agent