基于多视角视觉信息的餐厅推荐系统算法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:sulinpep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的逐步发展,人们越来越能更加快捷方便地获取信息。但网络技术的迅猛发展与网络信息量的快速增长,却使人们逐渐迷失在大量无效信息的包围中。信息超载问题伴随着信息科技与互联网的发展逐渐被人们重视、研究,由于信息超载问题使得人们在面对海量信息时无法有效获取自己感兴趣或者对自己真正有用的信息,使得信息整体的使用效率降低。与搜索引擎依靠特定策略和算法对用户提交的关键词进行搜索不同,作为解决信息超载问题的一个行之有效的办法,推荐系统通过研究用户的兴趣偏好与交互历史,进行个性化的计算,由推荐系统发现用户的兴趣点,从而引导用户发现自己的信息或商品需求。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生信赖关系。推荐系统领域近年来发展十分迅速,现已广泛应用于诸多领域。同时,学术界一直对推荐系统的研究保持高度热情,使得推荐系统逐步形成了一门独立的学科。在推荐系统中,餐厅推荐因其实用性一直是十分热门的研究领域。为了缓解推荐系统常见的数据稀疏、冷启动、可解释性、推荐的多样性等问题,餐厅推荐算法在使用用户侧信息、餐厅侧信息、用户-餐厅交互评分的基础上,往往引入各类异构数据,比如文本信息、社交关系、视觉信息等。其中,视觉信息作为十分重要的辅助信息之一,在餐厅推荐算法中具有举足轻重的地位。在引入视觉信息的餐厅推荐算法中,模型能挖掘用户对餐厅的视觉信息兴趣点,更容易、有效地进行个性化推荐。此外,餐厅的多视角视觉信息(比如,食物、饮品、餐厅内景、餐厅外景等)表达着餐厅不同视角的视觉信息。通过建立相应模型,研究人员能有效分析出用户在不同视角下的视觉偏好分布,从而对用户进行更加精准的个性化推荐。基于此,本文的工作主要分为以下几个方面:(1)基于多视角视觉特征信息,本文提出一种以隐式反馈数据作为输入的餐厅预测排序模型。利用深度卷积网络提取图像的视觉特征(视觉信息),并将其集成到协同过滤框架中。为了更好地进行个性化推荐,将多视图视觉特征通过用户权重进行融合。用户相关权重反映了该用户个性化的餐厅视觉偏好,用户之间的权重是不同的、独立的。模型被应用于两个真实的餐馆评论数据集进行实验测试,并为用户提供个性化的推荐。实验结果表明,具有多视图视觉信息的模型比没有或只有单视图视觉信息的模型具有更好的性能。(2)在深度学习的推荐模型基础上,本文提出一种基于层次注意力模型的餐厅推荐算法。该算法模型由两层注意力层组成:上层为类别注意力层,下层为图像注意力层。模型通过该层次注意力实现了对同一类别下的多幅图像(图像注意力层)和不同类别之间的图像(类别注意力层)分别进行建模。在注意力机制的帮助下,实验结果表明,该模型能有效追踪用户对于餐厅不同类别视觉特征和不同图像视觉特征的个人视觉偏好,并结合深度学习模型对用户进行个性化餐厅推荐。(3)为了挖掘餐厅视觉信息基于自身的表达,本文引入自注意力机制,提出了一种新的深度网络模型,将不同类别的图像作为推荐的辅助信息,利用自注意机制逐层分析单一图像内部、图像与图像之间、图像类别与图像类别之间用户的视觉注意力分布。另外,本文设置了一个有效的采样策略来针对大量的冗余图像进行简化。预测模型采用用户因素和餐馆因素的余弦相似度,并结合视觉信息。利用预先训练的神经网络从多类图像中提取餐馆的视觉特征。实验结果表明,该模型能有效对用户进行个性化餐厅推荐。随着互联网中越来越多的多源异构数据能够被获取,如何在推荐系统中融合多源信息,捕捉数据内部之间复杂的关系,成为推荐系统领域重要的研究课题。本文工作以现实中的图像信息着手,致力于发掘图像信息与静态数据之间的数据关系。相比于单一视觉信息表达,本文引入了多视角视觉特征,基于更加丰富的视觉信息,本文分别提出了带权重的视觉融合向量,基于层次注意力和基于自注意力的视觉特征融合方法。本文主要研究围绕餐厅的个性化推荐算法展开,利用传统的或深度学习的协同过滤方法对用户与餐厅建模,探索用户对餐厅的个性化喜好,并以此排序和作出推荐。
其他文献
图像分割是按照不同特征将图像划分成互不重叠、具有独特性质的各个区域,从而提取感兴趣目标的位置或者边界的过程.这一技术是进一步图像分析、理解的基础和关键,被广泛应用于多个领域,特别是在图像处理领域占据着重要的地位.迄今为止,上千种分割方法已被提出,通常都是针对特定问题的图像分割方法,具有一定的针对性和局限性,无法形成一个适合所有类型图像通用的分割算法.基于变分水平集方法和基于区域的活动轮廓分割方法在
背景:人工全膝关节置换术(Total knee arthroplasty,TKA)中在使用旋转平台假体(Rotating-platform prosthesis,RP)时,对后交叉韧带的不同处理方式中有两种假体设计分别对应两种手术方式,其中一种是后交叉韧带保留型旋转平台假体(Posterior cruciate-retaining rotating-platform prosthesis,CR-R
量子计算是依赖于量子力学原理来获得解的一种新型计算模型,由于量子计算的并行计算能力,量子计算在解决某些特定问题时,它比经典计算的效率要高。Grover量子搜索算法是量子算法中具有广泛应用前景的一种算法,算法可以在量子线路复杂度为/O(2n/2)的情况下求解一个规模为2n的搜索问题。本文从降低Grover算法的量子线路复杂度的角度出发,提出两种改进的算法,并将改进的算法应用到3-SAT问题上。1.为
随着信息化和数字化的快速发展,人们对信息传播质量的要求日益提高,作为传播最为广泛的媒体之一,数字图像的成像质量也成为了各行各业关注的焦点。然而,成像硬件、成像环境以及传输技术等条件的限制往往会降低图像的分辨率,导致图像信息的丢失。因此,如何将低分辨率图像通过算法重建为高分辨率图像始终是图像处理以及计算机视觉领域的一个热门研究方向。近几年利用深度学习算法进行图像超分辨率重建的研究逐渐增多,同时也取得
单目图像的三维人体姿态估计是计算机视觉中一项基本但富有挑战的任务,其目的是检测单目图像中的人体姿态并将其投影到三维空间中。随着科学技术的快速发展,三维视觉已成为人工智能研究和应用的热门领域,越来越多的专家学者投入到该领域的探索中。三维人体姿态估计精度一方面受图像外部遮挡、自遮挡和光线等因素影响,另一方面人体结构的特殊性也会给该问题的解决带来诸多困难。并且,如何将二维空间提升到三维空间本身是一个复杂
随着大数据、人工智能的高速发展,大数据系统平台数据量的规模呈爆炸式增长,庞大的数据量对数据存储和网络传输提出了不小的挑战,为了应对这一系列挑战,必须保证大数据平台数据存储中心的高效率存储和网络传输的高吞吐量,对平台上待存储的数据先进行压缩后再处理是应对这一挑战的有效手段,Gzip压缩算法因其压缩率高、压缩速度快被广泛应用于数据压缩领域。传统的Gzip软件压缩虽然可以实现数据压缩,但会占用通用处理器
随着大数据时代的到来,挖掘海量数据流的实时价值对于各行各业来说越来越重要。这类高速产生的流式数据通常具有实时性、动态性及持续性等特征,并且人们很难预测其未来的分布特性。分布式流处理系统可以满足企业人员处理实时数据流的需求。为了提高处理数据流的吞吐量,分布式流处理系统会利用流应用中的数据并行性。然而,倾斜分布的数据流常常会导致算子的并行实例之间的负载分配不均衡。其中,高负载的节点会拖累系统的处理速度
步态是一种流行的生物识别技术,可以远距离识别人类。它应该是唯一可以在远距离收集的生物特征。由于其独特的优势和在视频监控中的巨大潜力,在过去的20年中,许多研究人员对其进行了研究。尤其是近几年来,随着深度学习的发展,步态识别有了很大的提高。如今指纹、人脸识别的技术愈发成熟,但是步态识别技术的应用还面临许多挑战,比如摄像头视角变化、衣着变化等对识别的影响,所以我选择步态识别这个课题,希望能为解决步态识
多任务进化是进化领域中的一个新兴研究方向,主要研究如何充分利用任务之间的协同作用提高种群搜索的效率和性能。相对于传统的单任务进化,多任务进化能够通过多个任务之间的知识迁移提高算法的性能和进化的效率。基于多任务进化框架提出的单目标多任务进化算法和多目标多任务进化算法已经进化获得了优异的成果。本文对多任务进化算法进行了研究,并且对该领域做出了以下贡献:(1)提出了一个基于种群分布的两阶段知识迁移多任务
图像是日常生活中的重要信息媒介,在获取、使用等过程中,不可避免受到噪声的影响,破坏图像的质量,妨碍后续的处理。图像去噪问题是典型的病态逆问题,通常是图像迭代求解算法的关键步骤,需要利用先验信息对其进行正则化约束。通常图像去噪技术利用单幅图像的各种先验特征,结合不同滤波方法完成去噪,可采用的先验信息有限,难以有效选取特征保护图像边缘细节,且需手动多次调整参数,效率较低。近年来以卷积神经网络为代表的深