【摘 要】
:
在个性化推荐系统中,推荐算法处于核心地位,算法的准确性和拓展性直接影响着推荐系统能否投入使用。经过多年的研究和发展,衍生出多种推荐算法,其中以协同过滤算法的应用最为广泛。但随着应用场景的变化,算法本身存在的原始数据矩阵稀疏、冷启动和拓展性等问题也逐渐显现。针对这些问题,本文对推荐算法进行了研究,主要研究内容如下:首先,对于原始数据涉及范围广降低推荐算法的执行效率和准确度等问题,提出基于模糊均值聚类
论文部分内容阅读
在个性化推荐系统中,推荐算法处于核心地位,算法的准确性和拓展性直接影响着推荐系统能否投入使用。经过多年的研究和发展,衍生出多种推荐算法,其中以协同过滤算法的应用最为广泛。但随着应用场景的变化,算法本身存在的原始数据矩阵稀疏、冷启动和拓展性等问题也逐渐显现。针对这些问题,本文对推荐算法进行了研究,主要研究内容如下:首先,对于原始数据涉及范围广降低推荐算法的执行效率和准确度等问题,提出基于模糊均值聚类的协同过滤算法。算法通过对模糊聚类中距离计算和聚类中心选取等过程的优化,使聚类结果更加合理。融合了聚类过程的推荐算法不仅能够缩小计算范围,而且可以降低冗余数据对推荐结果的干扰,使推荐结果准确度和执行效率得到提高。其次,对于传统推荐算法面临的初始数据矩阵稀疏、冷启动和实际因素干扰等问题,提出基于矩阵填充和用户偏好的协同过滤算法。算法通过对稀疏矩阵进行分解和填充、改进相似度计算公式以及优化预测评分公式等多个环节改进现有算法存在的不足。然后,基于以上两种算法提出基于聚类和用户偏好的协同过滤算法,同时针对算法的拓展性问题,引入Spark分布式计算平台,给出推荐算法在Spark平台上并行化的部署思路。最后,将音乐数据集作为数据来源,对以上提出的改进算法进行实验,并对实验结果进行对比分析,证明改进后的算法在准确度和效率上的优越性。
其他文献
目的探讨128例老年高血压患者临床用药治疗的研究。方法选取2011年1月~2012年11月本院收治的128例老年高血压患者为研究对象,并根据老年人自身的特点制定个性化治疗方案。结
文章分析了中山大学附属第三医院截至2020年2月1日收治的5例新型冠状病毒肺炎患者四诊资料,其中1例高龄患者是危重患者,这一点与其他地区表现一致,而其余4例病情相对较轻,其
目的探索阿霉素不同的给药剂量和注射次数对模型的影响,确定阿霉素肾病大鼠模型的最佳造模条件。方法 54只成年雄性SD大鼠随机分为对照及模型A、B、C、D、E、F 7组,对照组于
传播速度快、感染范围广、防控难度高,新冠肺炎疫情既是一次重大突发公共卫生事件,也是一次大考。在与病毒的战斗中,工人无法按时返岗,就业机会减少等问题真实存在,愈发凸显解好就
目的:探讨香叶醇对肝癌细胞株Huh7增殖及TGF-b1/Smad 2信号通路的影响。方法:不同浓度香叶醇干预体外培养肝癌细胞株Huh7不同时间。MTT检测香叶醇对Huh7细胞生长情况的影响,
即将登陆深交所的贵阳朗玛信息技术股份有限公司(下称"朗玛信息")是一家主营社区性语音增值业务的"国家规划布局内重点软件企业"和"高新技术企业",公司以电话对对碰为主打产
1新时代基层党建阵地建设的重要意义习近平总书记在十九大报告中指出:"把企业、农村、机关、学校、科研院所、街道社区、社会组织等基层党组织建设成为宣传党的主张、贯彻党
内蒙古林业厅: 来电欣悉大兴安岭林区全体职工在党的总路线的光辉照耀下和八届八中全会决议精神的鼓舞下,干劲越鼓越足,生产一跃再跃,在提前完成全年木材生产任务的胜利基础
提出了一种集成式智能化电压调节器结构,讨论了有关汽车发电系统故障与异常现象,分析了由该集成结构实现各种故障及异常现象判断与处理的原理,并对该电路实现多功能指示与同步激
随着互联网技术的应用和推广,尤其是Web2.0技术的逐渐成熟和普及,越来越多的网民开始参与到互联网,他们不像以往那样仅仅被动地接受信息,而是有机会开始成为互联网的主角。随