基于行为序列挖掘的推荐算法研究与应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gaoyeye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息爆炸问题越来越严重。个性化推荐系统则是架在用户和信息之间的一座“桥梁”,对于目的不明确的用户,通过挖掘其隐藏的兴趣,为用户推荐其满意的物品,对于缓解信息过载问题具有重要作用,已经成为不可缺少的网上服务。在目前流行的推荐算法中,其根据独立的(用户,物品)对分析用户的潜在兴趣。然而实际上,用户的兴趣是动态变化的,并且物品之间也具有相互关联,这些重要的因素却往往被忽略。基于此,本文提出基于行为序列挖掘的推荐算法,重点挖掘用户历史交互序列中的时序关系和物品相互联系,将本文推荐算法定义为两个研究点:基于概率图的物品画像挖掘技术,以及神经网络预测模型的构建和训练。基于概率图的物品画像挖掘技术的研究,旨在建模物品的交互特征、相互关系,学习物品的关系向量表示。单个用户交互序列只能反映局部的依赖关系。为构造物品的全局关系表示,通过图的方式,将物品看做结点,将物品之间的关系映射为边,在一个全局图上综合表示每个用户的交互序列,并且,建模物品的交互时间间隔,反映物品间的转化概率和依赖关系的强度。在此基础上,通过概率化游走采样得到物品序列,然后设计ItemR2Vec模型,改进对物品时序特征及相互关系的学习,通过最大化物品序列的出现概率,训练模型从而得到物品的关系向量。然后,本文探讨点击率预测模型,设计多网络结构的DSIM模型,通过引入负样本物品,建模用户的相对偏好。DSIM模型从用户的交互序列中学习时序特征,从而预测用户的动态偏好。针对负样本,提出详细的反馈分级采样方法,构建公式计算负样本的概率,从而采样更典型的样本。同时针对实际应用场景中的预测加速和冷启动问题提出具体的解决方案,使其更切合大数据时代背景下的实践需求。接下来,将DSIM算法应用于点击率预估系统。首先将系统可获取的数据经过建模,转换为DSIM算法的输入特征。然后利用DSIM模型预测用户对广告的点击概率。当用户访问平台,触发广告请求,根据模型预测的广告点击率,结合竞价因子,从广告库中选取合适的广告,返回给用户页面。系统通过响应速度,吞吐量等指标的测试,显示出强壮的性能。最后,将DSIM算法在MovieLens数据集上和天猫数据集上与传统推荐算法和先进算法进行比较,实验结果展示DSIM算法的召回率、MAP、AUC等指标均有很大提升。实验还分析了推荐列表的长度、物品关系向量的维度、负采样参数组合等超参数对DSIM算法的影响程度,使得所提算法得到有效的验证。
其他文献
全球气候变暖以及环境的恶化,促使我们应加快步伐去寻找更为清洁无污染的绿色能源,而太阳能作为可替代的能源之一,引起了更多的探索。太阳能电池共经历了三代,其中第三代因其
我国上市公司是所有权与控制权分离的典型企业,近年来上市公司高管的“天价”薪酬已经成为社会上的焦点。不管经济面临危机或同行业相比下滑趋势,这些上市公司高管们拿的仍然
建构主义是最近几年来心理学领域发展最迅速、在外语教学过程中应用最广的理论。建构主义要求同时尊重教师的主导作用和学生的学习主体地位。从当前国内中职英语教育现状来看
云南腾冲皮影是一项拥有五百多年历史的民间传统艺术。自明代洪武年间从中原地区传入腾冲以来,在滇西范围内流传极广,并发展成了独特的腾越风格。本文通过对云南腾冲皮影的生存环境、工艺造型及社会功能进行解读,探究其艺术特征和审美内涵,提出一条腾冲皮影后续发展的合理轨迹。笔者以腾冲固东镇刘家寨刘家戏班为主要考察对象,通过收集腾冲皮影的各类艺术资料,实地走访调研、问卷调查等对腾冲皮影的发展现状、制作流程和工艺特
改革开放40年后的今天,我国已进入全面深化改革的攻坚期、全面建成小康社会的决胜阶段和实现中华民族伟大复兴“中国梦”的非常重要时期,近年来宗教极端势力主导的暴力恐怖事件频发使欧美民粹主义思潮再次崛起,国际形势的暗流涌动对我国民族工作开展产生了一定的冲击。作为统一的多民族国家,面对纷繁复杂的国内外环境,深入研究习近平总书记关于民族工作的重要论述对我国在新时代背景下不断开拓民族工作新局面、确保民族地区的
大型工程车辆在现代化建设中承担越来越重要的角色,其常在“非路面”环境下行驶、作业,故易受到来自各个方向剧烈的随机振动。且由于这类工程车辆自重大,需较大的刚度支撑其重量,然而当刚度过大时,其减振性能随之降低。由此可见,大型工程车辆驾驶员受到的各向随机振动尤为剧烈,这对其身心健康、操作稳定性造成严重影响。为解决上述问题,本文基于并联机构,提出一种可沿垂向移动、俯仰与侧倾向转动(1T2R)的3-RPS并
随着智能汽车和自动驾驶技术的发展,车联网通信(Vehicle to Everything,V2X)技术成为智能交通系统的关键技术之一。目前,面向第五代移动通信技术(The Fifth Generation,5G)的V2X标准化工作已由诸多国内外标准化组织积极推动全面展开,如3GPP(The Third Generation PartnershipsProject)等。由于V2X在实际应用与道路和行
随着多种成像传感器的出现及其应用领域的不断拓展,利用它们获取的多聚焦图像数据日益增加,通过分析这些数据可以发现,其互相之间存在互补性和冗余性。利用互补性可以让数据得到融合,进而使图像可以表现出更加全面和丰富的细节;利用冗余性可以让结果更加可靠,并且能够让信噪比得到改善。通过利用图像融合技术,可以处理同一场景中的多个图像目标,让目标的清晰度提升,让图像呈现出来的信息可以更加完整、全面。现在,很多领域
随着交通需求增大,我国各大城市快速推进轨道交通设施建设。深入挖掘地铁事故延误原因,准确预测地铁事故延误时间已成为交通安全研究重点之一。然而轨道事故数据多以文本形式存档,传统分析方法难以快速有效处理文本信息。另外,由于地铁事故延误时间分布不均匀,时间跨度范围大,使传统时间预测模型的预测精度不高,并且模型回归变量缺少对事故原因的描述,使模型存在一定的不合理性。因此,本文将主题挖掘方法与时间预测模型两者
目的:探究银屑平丸对BALB/c小鼠银屑病样模型的治疗作用及其对小鼠血清中IL-27和IL-31表达水平的影响。方法:按照随机数字表法将48只健康的BALB/c雌性小鼠平均分为正常对照组、模型对照组、阿维A药物组、银屑平丸低、中、高剂量组。将所有小鼠背部脱毛后,连续8天,每天对正常对照组小鼠背部皮肤适量外涂一次医用凡士林,其余组小鼠背部皮肤每天外涂一次5%的咪喹莫特乳膏;在造模的同时对各组小鼠进行