【摘 要】
:
在当今大数据时代,个性化推荐技术可以有效的提高用户体验,解决信息过载的问题。通过对大数据的分析,精准刻画用户模型,为用户推荐符合他潜意识的物品,为用户以及商业带来了极大的便利。其中属性信息作为真实有效的信息,融入之后可以更加精准的刻画用户和物品,提高推荐准确性。本文针对推荐领域矩阵分解特征矩阵的初始化问题、冷启动问题等问题,通过融入属性信息加以研究。矩阵分解特征矩阵初始化问题:传统的方式是特征矩阵
论文部分内容阅读
在当今大数据时代,个性化推荐技术可以有效的提高用户体验,解决信息过载的问题。通过对大数据的分析,精准刻画用户模型,为用户推荐符合他潜意识的物品,为用户以及商业带来了极大的便利。其中属性信息作为真实有效的信息,融入之后可以更加精准的刻画用户和物品,提高推荐准确性。本文针对推荐领域矩阵分解特征矩阵的初始化问题、冷启动问题等问题,通过融入属性信息加以研究。矩阵分解特征矩阵初始化问题:传统的方式是特征矩阵被初始化为一定范围随机值,这样容易造成预测结果陷入局部最优解和迭代过程收敛速度慢等问题,为了克服这些问题,本文提出了两种利用属性信息初始化特征矩阵的模型:1)基于属性映射的初始化模型,直接利用物品属性初始化特征向量,将物品被显著标明的属性看作显性特征,其他属性看作隐性特征,利用映射机制获得用户特征进行矩阵初始化;2)基于深度神经网络自动编码的初始化模型,为了加快计算的效率,改变第一种方式下特征维度的不变性,本文利用自动编码技术获取物品属性在低维上的抽象特征,然后利用此特征对SVD++进行初始化。推荐系统冷启动问题:本文主要解决用户冷启动问题,对于推荐系统中的新用户来说,用户没有历史评分,因而无法进行协同推荐。本文将属性信息作为用户的额外信息,首先求取用户属性间的关联性,将这种关联性应用到矩阵分解中,对比不加入属性的矩阵分解,推荐效果得到了提升,本文主要提出如下两种模型:1)基于属性偏置的矩阵分解模型,统计分析发现不同属性的用户评分具有明显的差异,本文根据用户的属性偏置信息,将用户属性偏置作为学习参数融入到矩阵分解中,冷启动用户利用属性偏置信息以及全局偏置信息获取推荐结果;2)基于属性近邻的矩阵分解模型,首先通过语义分析等方式计算用户属性相似度,然后利用决策树为用户分组,在组内找近邻,最后利用近邻构造属性近邻的矩阵分解模型。实验表明,本文提出的两种利用属性信息初始化特征矩阵的模型在推荐精度以及收敛效率上都优于传统的方式,基于属性映射初始化方式精度最高,基于自动编码神经网络的初始化方式精度略低于前者,但是时间效率上得到50%的提升,并在一定程度上缓解了属性稀疏带来的问题;提出的两种利用属性解决冷启动问题的模型,在一定程度上缓解了用户冷启动问题,优于传统的解决冷启动的模型。
其他文献
随着世界经济一体化的趋势不断增强,地区间、国际间的合作变得日益密切,在这背景下要特别强调合作。随着现代科学研究的深入,科研合作最有效的形式已经转变为团队合作,学科团队在各科研领域中扮演了重要角色。针对团队合作所表现出的网络关联性,可以通过复杂网络理论来描述。近年来,复杂网络链路预测问题受到学术界的广泛关注。链路预测是复杂网络分析领域的一项重要研究课题,可被应用于许多现实场景,如推荐系统、信息检索和
本文以韩城煤层气勘探开发示范区为研究区域,在分析研究区地质勘查、钻孔资料、矿井地质等已有资料的基础上,结合盆地演化与构造特征、层序地层学、沉积相分析以及水文地质条件,初步查明了研究区煤层气富集的控制作用。认识如下:(1)根据甲烷碳同位素含量数据进行分析,对研究区煤层气成因类型进行研究和划分,得出研究区煤层气成因类型为热成因气,其中部分地区煤层气明显经历了扩散运移等分馏效应,导致含气饱和度较低。(2
【关键词】百年党史 文艺思想 中国舞蹈艺术 【中图分类号】J709.2 【文献标识码】A 从纵深宏阔的百年历史中寻找党的文艺思想,印证了“其作始也简,其将毕也必巨”由“简”到“巨”的过程。从确立以马克思主义文艺观作为根本文艺方针,历经毛泽东等党中央几代领导人集体的文艺思想之光,直至习近平新时代中国特色社会主义文艺系列重要论述,聚沙成塔,玉汝于成。作为推动中国文藝事业发展前行的理论津梁,党的文艺思
提高效率是保持电子商务企业竞争力的必要手段,成本估算是项目管理效率的核心问题之一。本文利用近年来数据分析领域上的一些新技术,结合电商企业软件项目数量多,迭代快的特
随着互联网技术的飞速发展,社交网络作为复杂网络中一种重要表现形式,与人类的生活联系越来越紧密。社区结构是复杂网络中最为普遍且重要的一种特征。在社区结构中,同一社区内节点之间连接紧密、不同社区间节点相互连接稀疏。揭示网络社区结构的社区发现方法对分析社交网络拓扑结构、预测网络中节点的行为信息具有十分重要的意义。复杂网络中的社区结构越来越受到学术界以及工业界的广泛关注与研究,目前主流的研究方向包括复杂网
目的:构建乳酸刺激模拟运动的模型,评价不同乳酸浓度和乳酸刺激时间对肌肉因子IL-15的影响。为现代运动训练和大众健身对运动强度和运动时间的选择提供参考。方法:通过向小鼠股四头肌中注射不同浓度的乳酸钠溶液,分别检测小鼠骨骼肌内IL-15含量和IL-15mRNA表达的变化情况。实验分为两部分,第一部分是使用ELISA法检测乳酸刺激对小鼠骨骼肌IL-15含量的影响;第二部分是使用RT-PCR检测乳酸刺激
视觉是人类最高级的感知器官之一,而视觉感知外界是通过获取外界图像信息进行反馈的,因而图像在人类感知系统中具有重要的作用。人类对图像的认知首先是要获取到图像中的特征信息,而物体的轮廓是其中非常重要的特征之一,通过对轮廓的获取,才能有效的识别和定位。计算机视觉研究的最高目标就是用计算机视觉模拟人类视觉。在视觉应用中从图像中获取有效信息(如边缘、轮廓等)在该系统中处于承上启下的地位。在前人视觉机理模拟的
随着传感器、计算机技术和制造业的不断发展,移动机器人的发展达到了高潮。尤其是室内移动机器人,如随处可见的餐厅服务机器人,走进千家万户的扫地机器人,为物流行业做着贡献的自动导引运输车(Automated Guided Vehicle)等。但要想完成规定的任务,必然离不开精准的定位技术。而传统电磁导引定位技术布置复杂,且易受金属物干扰,而里程计长期定位精度又比较低。因此本文提出一种融合视觉信息与里程计
模型检验的主要优势之一是它能够在模型违反给定时态逻辑的情况下自动生成反例。反例提供了用于系统调试时的基本诊断信息,调试者可以根据反例,分析系统错误产生的原因,进而对系统进行修正,反例在调试复杂系统时可以提供很大的帮助。在随机模型检验中生成反例时使用精确算法通常会消耗太多的时间和内存,并且有时无法找到反例。更糟糕的是,在随机模型检验中生成smallest反例已被证明是NP完全问题,并且不太可能有效逼
跨摄像头多目标跟踪的任务是找到行人在不同摄像头的所有运动轨迹,该任务的挑战性在于:处理多个视频的多个目标运算量大,以及实际应用中行人姿态、光照、相机视角变化等造成不同摄像头下的行人外观差异较大。针对这些问题,本文应用一个分层推理结构的多目标跟踪算法框架降低运算复杂度,通过设计更好的外观特征表达增强数据之间的外观相关性关联以达到不同摄像头下的轨迹匹配的目的。本文采用基于图分区模型的单摄像头多目标跟踪