高可信度的推荐模型选择及其参数性能研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:luowanda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网使用者日益增多,各大网站的注册使用者和网站中的内容条目也在快速增长,这一现象加剧了用户信息选择困难的问题。推荐模型应运而生,其使用用户的历史记录、物品的属性数据以及实时跟踪用户需求改变来对用户提供个性化推送。推荐系统目前已经广泛应用于网络,不仅仅能实现精准推荐,节省查找时间,而且能为企业或商家带来大量商机,提高商品尤其是长尾物品的销售量。  单一的推荐方法总会产生不同的问题,目前学者们的研究重点已经由单个的推荐算法转移到混合推荐算法,说明混合推荐技术的发展非常重要,在学术领域具有较高的研究意义。本文将基于内容的推荐算法分别与基于用户和基于物品的协作过滤推荐算法结合,利用内容的属性数据求解用户-用户以及物品-物品的相似程度;将流行度数据联合基于用户的协同过滤推荐模型,利用流行度指标来调节物品之间的相近水平;将SVD与协同过滤推荐模型联合,运用其分解后的评分矩阵来求解用户-用户的相似水平。融合后的四种方法可以解决推荐系统因空缺值较多而产生的稀疏问题,以及用户和物品刚进入系统而无法产生推荐的冷启动问题。  对一次融合后的算法,本文利用组合预测对其二次混合,即组合推荐。组合推荐通过Shapley值来求解成员模型的权重参数。在系统的参数研究方面,本文利用Shapley值确定了组合推荐的权重参数;对TOP-N类型的N参数进行了讨论,给出了选取的结果趋势;对组合推荐的算法个数进行比较分析,确认了高可信度组合推荐模型的组合个数及对应的成员模型。在系统的性能评估方面,本文不仅与四个成员模型的结果进行对比,还和误差占比的混合推荐算法进行结果对比。针对推荐系统的评分预测类型,本文采用定量指标平均绝对误差和均方根误差来进行模型评估;对于推荐系统的TOP-N推送形式,本文采用准确率和召回率来评判模型。当准确率与召回率相矛盾时,采用PR曲线以及F值来进行综合评判。最后结果与预期一致,通过Shapley值确定权重的高可信度的推荐模型无论是在理论解释还是在数值模拟方面,都优于对照组的算法,可以有效提高推送精度。
其他文献
本文主要讨论一下能量依赖于速度的三阶特征值问题:Lψ=(a3+qa2+ap+ r)ψ=λψx所对应的Bargmann系统.  首先介绍了一些相关的概念,然后引进双Hamilton算子K,J,利用Lenard递推
在本文中我们将研究弹子球系统和非凸的哈密顿系统,利用Aubry-Mather理论将这两种动力学系统的研究联系起来。  众所周知,如果弹子球系统的边界曲线γ是光滑的凸曲线,那么内弹
胡锦涛同志在“七一”重要讲话中指出,十三届四中全会以来,以江泽民同志为主要代表的当代中国共产党人,以马克思主义的巨大理论勇气进行理论创新,逐步形成了“三个代表”重
本论文定义了时间尺度上的一类Sobolev空间并研究其重要性质,例如绝对连续表示定理,嵌入定理和该空间上一类泛函的连续可微性.作为这类Sobolev空间的应用,我们用变分方法中的临
《中共中央关于加强党的执政能力建设的决定》以邓小平理论和“三个代表”重要思想为指导,全面阐述了在新的历史条件下加强党的执政能力建设的重要性,科学总结了我们党执政5
本文在n维欧式空间中研究了一些择一性定理,这些择一性定理是在凸函数、线性函数和一个凸集上讨论的.然后把择一性定理应用到凸规划问题中,这个凸规划问题具有等式约束和一个约
这篇论文研究的领域是风险理论的核心内容-破产问题,主要讨论连续时间下带投资的二维破产模型,该模型以两家公司按照一定比例共同承担同一理赔为研究背景,文章的主要目的是要对
克拉申的第二语言习得理论由五个假说构成,其中的核心部分是“输入假说”.克拉申认为,只有当习得者接触到“可理解的语言输入”(comprehensive input),即略高于他现有语言技
本论文分别研究了具有阶段结构的非自治食饵-捕食系统在带有收获项或带有收获项与脉冲效时应时多个正周期解的存在性.首先应用Mawhin延拓定理将所研究的系统的正周期解存在性
设V是域K上的一个有限维向量空间,V上的有序线性变换对A:V→V和A*:V→V称为 Leonard对,如果这个线性变换对满足以下两个条件:   (ⅰ)存在一组基,使得 A在这一组基下的矩阵