面向信息过载的个性化推荐算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:zsjhmya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和网络设备的普及,互联网已经成为了人们获取信息的主要渠道,尤其是随着互联网的商业应用不断扩大和普及,商业服务互联网日趋成熟。另一方面,随着互联网商业用户的不断增加及用户对服务质量要求不断提高,网络中数据量急剧增加,“信息过载”问题日趋严重。门户网站和信息检索工具的负荷越来越大,处理能力受到了极大的挑战,尤其是当用户不能清晰地描述他所需的信息时,上述的两种技术均无法有效处理用户个性化的需求。在这种情况下,基于用户偏好的推荐系统应运而生。推荐系统可以根据用户的背景信息和历史操作数据进行信息过滤,并实现个性化的数据推荐。因此,个性化推荐系统被确认为是有效解决互联网中“信息过载”问题的关键技术之一,受到了世界范围的关注。本文详细阐述了推荐系统的发展背景和个性化推荐算法的国内外研究现状,系统分析了当前推荐系统中对推荐结果影响比较大的用户历史评价数据稀疏、新项目的冷启动和推荐结果覆盖率低等问题,在深入研究传统的基于用户的协同过滤算法和二分图推荐算法的基础上,提出了基于聚类分析与隐特征因子模型的协同过滤算法和基于项目信息与用户偏好信息的异构图协同排序算法。论文中主要的研究内容和创新性成果如下:(1)针对传统的基于用户的协同过滤算法中存在算法时间复杂度较高和数据稀疏导致的推荐精度不高的问题,本文提出了基于聚类分析与隐特征因子模型的协同过滤算法。该方法引入聚类算法,将用户划分为多个类别,将用户-项目评价矩阵分解为多个低维度矩阵,降低了算法的时间复杂度。此外,给出了基于隐特征因子模型的评分预测方法,利用该方法在训练集中拟合用户的真实的评分,从而减小了预测的评价值与真实的评分间的差异。利用公开数据集进行了仿真实验,仿真结果表明,所提方法在实时性和推荐结果的准确性等方面明显优于传统推荐算法。(2)为了避免新加入项目的冷启动、推荐结果的马太效应和用户评价数据的稀疏等问题在协同排序过程导致Top-n推荐场景复杂化的情况,本文提出了基于项目信息和用户偏好信息的异构图协同排序算法。所提算法通过构建异构图来对用户偏好的优先级和用户与项目的关系进行建模,充分利用项目标签信息和用户的偏好信息。此外,本文对传统的PersonalRank算法进行改进,在计算过程中充分考虑了用户偏好,有效地提高了所提算法的收敛速度。仿真实验表明,相较于传统的二分图推荐算法,所提算法在推荐结果的准确性和覆盖率等方面有了较为明显的提高。
其他文献
在机器人领域,移动机器人在未知环境中能够进行自动定位和制图(SLAM)以及感知周围环境的语义信息,是自动驾驶、无人车以及服务性家庭机器人等行业的关键技术,也是计算机视觉领域最前沿的研究方向,但是在定位精度和对周边场景的环境感知方面存在很大的问题。因此,本文的主要研究内容为基于视觉SLAM和深度学习的室内语义地图构建。本文通过RGB-D相机,实现对自身的定位并感知周边场景的环境,从而就可以构建具有语
学位
柔性电子技术,区别于传统基于硬质硅基底传感器,具有可弯曲、可拉伸等特点,未来有可能引发一场新的电子技术革命。目前,国内外众多科研机构都对柔性电子技术展开了深入的研究,使得柔性电子成为了研究热点之一。3D打印技术,因其独特的增材制造优势,被认为是一项有着巨大潜力的制造技术,英国经济学人杂志认为其将与信息技术共同推动第四次工业革命。本文将柔性电子与3D打印技术相结合,研究柔性电子传感器件制造与应用,发
学位
随着近年计算机技术的进步,需要处理的数据量级越来越大,维度越来越高。更高维度的数据往往蕴含更复杂隐蔽的潜在联系,这使得数据中蕴含的信息愈发难以观测。因此,如何高效地处理分析可视化这些多维数据一直是当今数据研究领域的热门话题。一方面由于以人类认知的局限性难以观测多维数据并想象高维空间的数据分布,多维数据可视化方法往往是数据分析的第一个环节。多维可视化方法利用多种算法将多维数据在人类可以观测的空间内展
学位
板坯号是钢铁企业热轧生产过程中板坯的唯一标识,板坯在进入加热炉生产之前,当前主要是依靠人工方式对板坯号进行识别,劳动强度高且容易出现识别错误。所以,利用图像处理和深度学习等人工智能技术实现对板坯号的自动识别,对于降低劳动强度、提高钢铁企业热轧厂的信息化和智能化水平具有重要意义。本文针对热轧厂加热炉工序的板坯号自动识别问题,基于深度学习和图像处理等方法,分别针对数据集自动构建方法、板坯号的单字符识别
学位
由于肺癌的临床表现复杂多样、但其恶化速度却十分惊人,所以肺癌的早期诊断有着重大意义。传统的基于图像处理技术的肺癌诊断方法,主要依靠基于医生经验的手工特征,如灰度、纹理等来实现,无法利用结节的视觉特征区分其与血管等其他组织,往往无法取得较高的准确率。近年来,随着深度学习的迅猛发展和有标注医学图像数据的骤增,将深度学习算法应用到计算机诊断技术中已经是大势所趋。为了减少肺结节的漏检和错诊,提高肺癌诊疗的
学位
随着全景技术的发展以及深度学习技术的广泛应用,全景图像的目标检测与人工智能方法相结合成为极具发展前景的一种视觉应用场景。同时,有效的深度学习网络模型为各行各业的人工智能研究提供了理论依据,极大地促进了互联网公司(如百度自动驾驶部门)、车企(如特斯拉公司)等机构基于学习架构构建无人自治系统的研究与应用。全景环境下道路目标的准确检测能够作为自动驾驶的基本感知能力,保证驾驶的安全性,是实现L5级无人驾驶
学位
经过半个多世纪的发展,机器人技术已经对人类的生产和生活方式产生了深远影响,并成为衡量一个国家科技创新和高端制造业水平的重要标志。新的社会发展趋势表明:未来新一代机器人系统将从更多的方面模仿人,尤其是,机器人与人之间应更多地表现出一种和谐共存、优势互补的合作伙伴关系,即:与人共融是新一代机器人系统的最本质特征。为了实现机器人与人共融,需要机器人能够感知交互者身份,进而与人自然交互。因此,机器人准确感
学位
目前,无人驾驶、机器人、增强现实等行业正在快速发展,对于机器人等智能设备来说,能准确的获取自身位置并感受周围环境具有非常重要的意义。同时定位与建图(SLAM)正是解决这一问题的关键技术。机器人通常需要工作于复杂的环境之下。其中,动态环境是影响机器人SLAM的重要因素之一。在动态环境下,机器人等无人设备的定位会受到动态因素的严重干扰,以致于经常出现定位失准的现象。同时,如何建立可以帮助机器人进行导航
学位
石油属于全球重要的战略资源,其需求量日益增大,国家经济的发展离不开它。由于石油具有易燃的属性,极易引发火灾、爆炸,给人民生命财产造成巨大的损失。因此,石油储运的消防工作至关重要。油库负责接收、存储和发放原油或成品油,主要由油罐区和泵房区组成,对油罐区和泵房区进行火情检测是保证油库消防安全的必要手段。近年来,随着计算机和现代通信技术的引入,油库消防设施的自动化和智能化水平显著提高,然而,目前油库火情
学位
工业机械设备的稳定运行是确保企业生产活动正常进行的关键因素。在机械设备中,滚动轴承是应用最为广泛的零部件之一,但同时也是机械设备中的故障多发零部件。如果轴承故障得不到及时的诊断与检修,不仅使企业不能完成正常的生产任务,甚至会影响设备使用寿命,造成财产损失及人员伤亡等灾难性的后果。因此,对滚动轴承故障状态进行早期诊断十分必要,且有重大的实际应用价值及理论研究意义。目前,经验模态分解(EMD)算法和最
学位