【摘 要】
:
随着互联网的迅猛发展,信息呈指数级增长。面对如此庞杂的信息,帮助用户快速、有效地获取需要的信息成为一项具有挑战性的工作,这也是当前学术界研究的热点问题。学术界和业界针对信息过载问题开展了大量的研究和实践工作,提出了多种个性化解决方案,希望为用户提供符合其需求的信息。而推荐系统就是解决此问题的有效方法,它是一种个性化信息服务系统,通过推荐算法实现有针对性的个性化推荐。而协同过滤是在推荐系统中应用最成
论文部分内容阅读
随着互联网的迅猛发展,信息呈指数级增长。面对如此庞杂的信息,帮助用户快速、有效地获取需要的信息成为一项具有挑战性的工作,这也是当前学术界研究的热点问题。学术界和业界针对信息过载问题开展了大量的研究和实践工作,提出了多种个性化解决方案,希望为用户提供符合其需求的信息。而推荐系统就是解决此问题的有效方法,它是一种个性化信息服务系统,通过推荐算法实现有针对性的个性化推荐。而协同过滤是在推荐系统中应用最成功和最广泛的一种推荐算法。协同过滤通过用户评价过项目的历史评分数据来预测未知项目的用户评分,但随着互联网不断发展与普及,像淘宝、抖音、微信这样的大型平台用户数都已过亿,而且其中的项目资源也增长至千万级。但大部分用户仅仅对个别项目进行过评价,而且用户评价过的项目也不尽相同,因此用来进行预测评分的用户-项目评分矩阵变得极端稀疏。很难根据这些数据找到偏好真正相近的用户,传统基于协同过滤方法所生成的推荐质量越来越差,稀疏性问题己成为影响推荐效果的关键问题,因此需要新的方法来解决这个问题。而用户画像的产生原因是为了准确、高效地分析用户的偏好信息,将其与协同过滤相结合可能会改善这一问题。并且有调查显示80%的用户愿意向平台提供自己的姓名、年龄、性别等基本信息。因此笔者就对如何使用用户基本信息构建用户画像、如何将用户画像融入到协同过滤进行了研究。提出了一种构建用户画像的用户信息度量模型,一种基于用户画像与协同过滤的混合推荐模型UPCF。本文在实验阶段考察了相似度量模型(PCC、COS、ADCOS)、评分预测算法(DFM、WS)、不同用户特征对混合推荐模型UPCF的影响,并在其中选出了使UPCF模型表现最优的组合。然后将此UPCF模型分别与UBCF、SM模型在MAE、Precision、Recall、F1四种评价指标下进行了比较,实验结果表明本文提出的方法在这四种评价指标上,确实要优于传统的UBCF、改进的SM方法,证明了本文提出的方法提高了协同过滤推荐算法的预测准确性,缓解数据稀疏性问题带来的影响。
其他文献
基于建筑造型需求,坡屋面被广泛应用到现代建筑中,但同时,给结构设计带来了难点和困扰。论文结合贵州威宁农特产品项目坡屋面结构.采用通用设计软件PKPM进行分析。以研究不同的坡
线栓法大鼠大脑中动脉阻塞(MCAO)模型被普遍认为是脑缺血标准动物模型。该模型在制备过程中,易受到多重因素的影响。文章从血管解剖位置、插线的制备、切口位置、插线深度及
目的了解闵行区外来和常住小学生的贫血患病率及贫血构成比的差异,探索其各自存在的营养问题,为有针对性地采取干预措施提供依据。方法采用随机整群抽样方法,抽取闵行区小学
应用Harper的构件生物结构和种群生态学理论,对海子坪天然毛竹种群生长规律进行了系统的研究。结果表明:天然毛竹竹笋出土的持续时间约为50d左右,以4月5日前后5d的为出笋高峰;高
CRH5型动车组的广泛应用使得其可靠性要求越来越高,而异步牵引电机作为牵引系统的重要部分,对其进行实时监测尤为关键。首先,结合CRH5异步牵引电机的工作状态,提出一种未知输
高校图书馆馆藏的必不可少的组成部分是学位论文资源,它属于高校科研与教学的一种关键性信息资源。分析了高校学位论文的特点和情报价值,阐述了高校图书馆开发与应用学位论文
目的:探讨益气聪明汤加减治疗老年性痴呆(AD)(脾肾两虚型)的临床疗效。方法:将60例AD患者随机分为治疗组与对照组。对照组30例予盐酸多奈哌齐片治疗;治疗组30例予益气聪明汤
目的:观察补气生药系列药对含药血清对血虚模型小鼠骨髓造血功能的影响,为阐明中医"补气生血"治则提供实验依据。方法:连续4天腹腔注射环磷酰胺30 mg/kg复制化学性血虚小鼠模
孙桂芝教授是中国中医科学院广安门医院著名中医及中西医结合肿瘤学家,学术底蕴丰厚,经验宏富,疗效卓著,深受广大患者及行业同仁信赖与推崇。她认为,恶性肿瘤组织生长迅速而
目的:研究北虫草有效成分对机体生理功能的影响。方法:氨基酸含量测定采用氨基酸分析仪,其他各种有效成份的测定均采用高效液相色谱法。血红蛋白(Hb)含量、红细胞(RBC)和白细