基于局部建模与全局融合的推荐算法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhouxin313333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网内容信息的快速发展,个性化推荐系统逐渐成为解决信息过载的重要工具。随着网络上用户和物品的快速增长,常见的进行全局推荐建模的方法不仅在训练和存储上将面对更大的开销,也要面对大规模数据带来的稀疏性和噪声干扰。本文研究如何通过将全局数据拆分成多个用户和物品构成的局部群组,进行局部建模和计算,再融合局部计算结果得到全局推荐结果。基于这种局部建模与全局融合的思路,本文对推荐系统中的评分预测任务和Top-K推荐任务进行了深入研究,提出了以下三种模型:(1)基于特征偏移度量构建局部矩阵的评分预测算法FDLMA。FDLMA通过先选择锚点,再为锚点选择邻域来构建局部用户-物品矩阵。首先提出了一种基于代表度的锚点选择算法,选择了自身密度较大,且距离较远的一批(用户,物品)对作为锚点。提出采用特征偏移来计算用户之间或物体之间的距离,从而构建内部兴趣更为集中的局部矩阵。(2)基于矩阵解构与重构的评分预测算法DRMA。DRMA通过矩阵解构-局部矩阵近似-矩阵重构的三个阶段对评分矩阵中的空缺值进行预测。在矩阵解构阶段,针对现有构建局部群组要先训练用户和物品的特征向量再进行距离计算的问题,DRMA另辟蹊径,从用户-物品二分图的角度提出了基于两阶段随机游走的方法构建了局部矩阵。在局部矩阵近似与矩阵重构阶段,DRMA提出根据不同局部矩阵的数据分布实现局部模型的差异化训练和融合。(3)提出局部排序与全局融合的Top-K推荐算法LRGF。LRGF首先提出一种成对差距感知的贝叶斯排序算法pgBPR,将用户对成对物品的偏好差距融入排序学习中。局部排序阶段,在每个局部群组利用pgBPR直接生成局部推荐列表;全局融合阶段,提出一种基于群组感知和排序得分的决策融合策略,直接融合局部列表得到全局推荐列表。为了验证本文提出三个模型的有效性,分别在多个真实世界数据集上进行实验,并与其他推荐模型进行对比。实验结果表明,本文提出三个模型均能实现优秀的推荐效果。其中FDLMA和DRMA算法对用户评分的预测误差不仅要小于经典的全局矩阵分解模型,也要小于其他的局部建模方法;LRGF算法生成的推荐列表,其排序和命中结果在绝大多数情况下也要优于其他对比算法。
其他文献
背景和目的:动脉粥样硬化是一种炎症性疾病,我们前期的研究表明,Cag A在体外通过NLRP3/caspase-1/IL1β信号通路上调粘附分子和炎性细胞因子的表达,增加人主动脉内皮细胞粘附功能。但抑制NLRP3能否在体内发挥抑制CagA的促动脉粥样硬化早期发生作用仍未可知,为了探究这一假设,我们试图在ApoE-/-小鼠中探索NLRP3在CagA促进的动脉粥样硬化进程中的作用。方法:把给予HFD饮食
2型糖尿病(Type 2 diabetes mellitus,T2DM)、糖尿病周围神经病变(Diabetic peripheral neuropathy,DPN)和糖尿病肾病(Diabetic nephropathy,DN)已经发展为全世界关注的重要健康问题。尽管有很多可供选择的药物进行治疗,但是由于疗效低和副作用等问题,仍然迫切需要找到新的和更有效的治疗药物以及进一步阐明其发病机制。二苯基二硒
智能仓储技术是机器人化智能制造的未来发展的重要组成部分。在机器人化智能制造过程中,智能仓储技术能提高仓储管理工作效率、降低投入成本,是其中重要的一环。RFID(Radio Frequency Identification)传感器是物联网的核心组成部分,具有唯一ID识别、非视距传播、不受光照影响、成本较低等诸多优势。近年来,由于RFID传感器的独特优势,其在出入库盘点、物流接驳、智能仓储管理等应用场
近年来,被动毫米波(Passive Millimeter Wave,PMMW)辐射测量技术受到了国内外研究人员关注,被广泛运用到安防检测、地形测绘和军事目标探测等近距离(相对于遥感)观测领域。PMMW辐射测量技术具有被动接收信号、穿透云雾能力强、全天时等优势,将PMMW应用于海洋遥感、海上目标探测等具体场景中可以作为主动雷达、红外等探测体制的互补技术,具有极高的研究价值和迫切的应用需求。当前针对P
金属有机框架材料(MOF)是以金属离子为中心、有机配体为连接体,通过配位键合所形成的新型有机-无机杂化材料,一般具有大比表面积、高孔隙率和多活性位点等特点,在金属腐蚀防护领域具有广阔的应用前景。首先,本文合成了一种新型Cu-MOF材料,用作盐酸介质中碳钢的缓蚀剂,并进一步探究了Cu-MOF与硫脲、六亚甲基四胺之间的缓蚀协同作用。同时,以MOF-5作为BTA缓蚀剂载体,制备了能缓慢释放BTA缓蚀剂的
在短距离光传输中,成本成为了一个重要问题。相较于相干接收机复杂的接收结构和高昂的成本,直接调制直接检测结构更令人青睐。直接检测存在色散补偿问题和信号与信号拍频噪声(SSBN)问题,如何消除色散和SSBN影响成为近些年的研究热门。另一方面,在移动前传网中,增量总和(Delta-Sigma)调制技术被应用于无线信号发射机中,极大地降低了数字前传(FH)的成本和复杂度。针对系统成本和直接检测存在的问题,
陶瓷介质谐振腔滤波器是5G通信基站上的重要部件,在滤波器生产中,可能会出现PCB板弯曲、镀银层破损、陶瓷体开裂等缺陷,这些缺陷会影响滤波器的性能,为了保证生产出的滤波器的质量,就需要对5G陶瓷滤波器进行检测。本论文的研究内容就是设计滤波器陶瓷表面的缺陷检测算法和滤波器点云处理算法。本论文针对结构光扫描系统得到的滤波器的点云文件设计了点云处理算法,成功测量了滤波器PCB的平面度和共面度,并且将点云处
传统固溶体合金体系的开发逐渐接近瓶颈,亟待新的合金设计理念,高熵合金的概念应运而生。高熵合金按照微观结构可以分为单相、双相和多相高熵合金几种类型。通常,单相高熵合金体现出单方面的性能优势,如面心立方(FCC)结构的高熵合金具有很高的延展性,但强度较低;而体心立方(BCC)结构的高熵合金强度很高,但很脆。双相高熵合金可以综合两种相结构的优势,如具有FCC+BCC双相结构的高熵合金在韧性和强度方面分别
大数据时代的到来,复杂网络出现在真实世界的各种场景中,高质量的网络分析可以让用户更加深入地理解海量数据背后的内容,从而有助于节点分类、链接预测和可视化等重要的网络分析任务。然而大多数网络分析任务都存在计算量大和空间开销大的问题。网络表示学习是解决网络分析任务的一种深刻且高效的方法,它将网络节点映射到低维向量空间,同时最大限度地保留原始网络的结构和属性信息。基于随机游走的网络表示学习算法因其具备良好
车间生产资源调度与分配问题属于资源约束下的项目调度问题(RCPSP)的一个变种,在生产资源紧缺和人力资源紧缺的前提下,如何最优化生产资源配置、人力资源配置以及各种生产任务下的调度方案,保证有充分能力完成各项生产任务,就是这一优化问题的主要内容。解决这一问题,可以大幅节约时间、空间、软硬件以及人力成本,具有一定的理论意义和实用价值。针对车间生产资源调度与分配问题本文提出了两种启发式算法。首先对车间生