基于密度峰值聚类和降噪自编码的推荐算法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:suntiger2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络用户的急剧增加,人们的生活方式、信息传播方式已经完全改变,人们面临信息过载问题,个性化推荐是解决该问题的有效方法之一。个性化推荐系统的核心是推荐算法,目前常用的协同过滤推荐算法虽然具有其的自身优势,但仍然存在着一些问题,如数据稀疏性问题和冷启动问题等,由此导致了推荐算法的性能、准确度等问题。因此,本文针对传统协同过滤推荐算法存在的问题从多个角度对算法进行改进,具体的改进方法归纳为以下几点:(1)项目隐特征的提取。为更好的分析项目之间的关联关系,将用户-项目评分矩阵作为CBOW词向量模型的训练语料,通过词向量模型训练得到词向量矩阵,并利用降噪自编码网络DAE对项目进行隐特征提取,得到基于项目关联性的隐特征矩阵。(2)用户隐特征的提取。为更精确的提取用户的隐特征,根据用户个人偏好形成用户偏好矩阵,并利用降噪自编码网络DAE对用户进行隐特征提取,得到用户基于个人偏好的隐特征矩阵。根据项目隐特征和用户隐特征构建基于降噪自编码的词向量和个人偏好推荐算法WP-DAE。(3)密度峰值聚类的改进。为了使数据服从真实数据的分布,在密度峰值聚类算法的基础上加入约束对的监督信息。计算用户-项目评分矩阵相似度,根据相似度值进行用户兴趣度聚类,同时提高算法的在线推荐效率。(4)信任度计算的改进。首先在传统的信任度计算上引入信任因子,用以区分不同用户之间的信任度。由于不是所有用户之间都存在直接信任关系,因此加入间接信任度值,以提高对目标用户的精确匹配。根据兴趣度和信任度构建基于信任度值计算与兴趣度的半监督密度峰值聚类的推荐算法IT-SDPC。本文通过利用公开的数据集进行实验,选用常用的评价指标MAE和RMSE对本文提出的方法进行评价,结果表明本文所提的方法可以有效的提高推荐结果的准确度。
其他文献
阿尔茨海默症(Alzheimer’s disease,AD)是一种与年龄相关的缓慢进行性神经系统退行疾病,极大程度上影响老年患者的正常生活。目前临床上对阿尔茨海默症的诊断方法仍是传统的心理学测试和临床的询问等,误诊率高且容易错过最佳治疗时期。数十年来,功能磁共振成像技术(functional Magnetic Resonance Imaging,fMRI)高速发展,越发广泛的关注聚集于基于fMRI
随着我国近年来天然气工业的不断发展以及城镇居民生活水平的不断提高,天然气作为清洁能源,其已经成为城镇居民的重要生活能源。天然气门站作为天然气长输管线的终点站,同时也是城市的接收站,其肩负着对上游来气进行净化、计量、调压、加臭、输送的重要责任。本论文以河北衡水“大营2*75 MW级燃气热电联产项目天然气供气管道大营门站工程”项目为课题来源,设计开发了一套天然气门站监控管理系统,用以保证大营天然气门站
随着中国互联网事业的不断发展与进步,网络上产生的信息量呈指数式增长。在这样的背景下,推荐系统作为信息过滤的重要方法,越来越受到人们的关注。虽然推荐系统经过几十年的研究与发展,其性能已经得到了大大提升,但评分数据稀疏和冷启动等问题,仍制约着推荐系统的推荐性能。针对推荐中数据稀疏和冷启动的问题,本文在传统推荐算法的基础上引入了深度学习,提出了一种基于非负矩阵分解与深度学习的推荐算法。为提升推荐系统的推
当前的人脸识别技术已能准确识别出访问者是否存在于底库中,但仍很难分辨访问者的真实性,即是本人直接访问还是他人冒充该个体的信息进行访问。人脸活体检测技术对于保障识别系统的安全性起到了重要作用,尽管目前基于深度学习的方法能提取图像中的语义特征,并利用人脸深度信息和时序信息作为辅助监督,但仍存在四点不足:第一,仅采用均方误差损失来约束人脸深度预测网络的训练,预测结果仍待提高。第二,聚焦于深层的语义特征,
随着人们生活水平的提高,与肝脏器官病变相关的患者数量逐年攀升。肝癌给患者及其家属造成了无法估计的损失。电子计算机断层扫描(CT)技术具有无创、图像清晰和高密度分辨力的优点,是一种常见的检查手段。随着深度学习技术的发展,许多研究人员将深度学习技术应用到医学图像分割领域。在肝部CT图像中的肝脏和肝肿瘤分割任务中,肝脏和肝肿瘤具有位置多变、形态各异和边界重叠等特点,本文对经典U-Net模型进行改进,针对
“脑卒中”又称“中风”,是一种由大脑血管突然破裂或阻止血液流向大脑引起的脑血管疾病,最终会导致脑组织损伤,致残率和死亡率较高。MRI技术是一种无损成像,并且可获得较高分辨率的组织结构图像,对脑组织的精确分割是脑卒中诊断脑组织损伤程度的前提。MRI脑图像分割中常用的方法是核模糊熵聚类(KFEC)算法,虽然该算法通过优化隶属度值以及对输入数据进行高维映射,消除了MRI脑图像中的部分噪声,但仍存在三个主
近几年阿尔茨海默病(Alzheimer’s disease,AD)的患病人数不断上升,目前全世界约有5000万AD患者,我国约占其中的25%,AD患者临床表现为记忆障碍、失语、失认等,给患者家庭带来沉重的心理影响和经济负担。弥散张量成像(DTI)依据水分子的弥散程度制图,通过纤维束追踪可有效揭示AD患者大脑中脑白质的结构变化,对于AD患者的早期预防和诊断具有重要的研究价值。基于DTI图像的纤维束追
皮肤作为人体中唯一的体表器官,是抵御外界有害物质进入人体的第一道屏障,因此很容易受到各种伤害而产生病变。黑色素瘤作为皮肤病中危害最大的一种疾病,不仅转移速度快,而且病情发展迅速,死亡率在皮肤性疾病中高达75%,如果能在发病早期对黑色素瘤进行准确的识别,通过手术切除治疗,可以在5年内使患者的生存率达到97%以上。因此,对早期皮肤镜黑色素瘤图像进行准确的判断识别可以帮助成千上万的患者得到及时的救助,避
学位
近年来,随着地下空间开发加速与能源利用效率提升,地下综合能源监测系统具有越来越重要的意义,同时物联网发展迅速,能够满足更高效、便捷的监测需求。本论文对应用场景进行了需求分析,针对地下空间分布距离远、监测参数多、工作设备多、公网信号盲区的问题,设计了基于LoRa通信的地下综合能源监测系统。首先,设计了基于STM32的LoRa通信设备的硬件电路。采用STM32F103C8T6芯片作为主控模块,采用SX