基于多视图锚点图哈希技术的推荐算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:jjjjjjj7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和网络技术的发展,互联网上的信息和资源出现了爆炸性的增长。为了提高用户的有效信息获取能力,个性化推荐系统将会发挥越来越重要的作用。传统的协同过滤推荐技术往往只能利用单一视图下的用户信息,且需通过高维向量之间的运算才能够计算出对用户偏好的预测评分,需要很高的计算和存储代价。我们提出了一种基于多视图锚点图哈希技术的协同过滤推荐算法,融合了不同视图下的用户信息,并利用基于哈希学习的近似最近邻搜索技术,实现了高效、高质量的推荐结果计算。本文的主要工作有:首先,针对多视图数据,我们提出了一种利用多视图局部锚点嵌入的锚点图构建方法,实现了不同视图数据的融合,既保留了不同视图内的原始信息,又保留了视图之间的原有结构,同时得到了用户总体相似度矩阵的一个低秩近似。其次,利用构建得到的多视图锚点图,我们提出了一种多视图数据下的哈希算法,为多视图数据学习具有相似度保留特性的二进制哈希编码。此外,对于训练样本外数据点,我们也提出了一种二进制编码的快速计算方法。最后,在所提出的多视图哈希方法的基础上,我们利用二进制编码的特性以及近似最近邻搜索的方法,提出了一种快速生成查询用户的相似用户集合的方法。通过将相似用户的快速搜索与传统的基于用户协同过滤方法相结合,我们最终提出了一种基于多视图锚点图哈希技术的协同过滤推荐算法。通过在不同数据集上的实验,我们证明了所提出的推荐算法的效果。
其他文献
学位
随着互联网的普及和电子商务的发展,推荐系统在电子商务系统中起着越来越重要的作用。它可以将电子商务网站的浏览者变为购买者,提高电子商务网站的交叉销售能力,保留已有用
随着遥感技术以及高分辨卫星技术的发展,当今社会对高分辨率遥感卫星数据的存储以及访问的需求在越来越大,另外随着分布式技术在大数据的环境下发展也越来越成熟,也有越来越
本论文旨在研究统计机器翻译中的调序问题。特别地,我们选择了对基于层次短语的统计机器翻译模型的规则选取问题进行研究,这是因为基于层次短语的翻译模型的调序能力主要依赖
近几年,为了缩短软件的开发周期和提高软件的开发质量,柔性的软件开发模式被提出。柔性软件开发模式能灵活和快速地响应用户需求的变更。其主要特点有以下四点:模型是可模拟的
随着中国互联网用户的爆炸式增长,中文信息处理技术在互联网领域受到越来越多的重视。中文组块分析,因其在具有词法分析效率的同时又具有接近于完全句法的分析深度,在互联网领域
随着计算机技术和网络技术的飞猛发展,人类社会的信息化进程大为加快,对信息的依赖程度越来越高。保险公司也依靠IT系统处理案件。自从20世纪70年代《协同学导论》的出现,使
针对互联网个人影像产品制作过程中,传统手工操作复杂、耗时、并造成网络与服务器高负荷运转的问题,探讨了一种基于等级变异与图像内容特征信息的免疫克隆算法。并以比较复杂
三峡库区河段地质情况复杂,桥梁众多,常常发生船桥相撞事故,对航运安全形成威胁。为此论文提出对三峡库区航运安全进行虚拟现实仿真系统及相关技术的研究,以三峡库区重点航段
共指消解是自然语言处理中的核心任务,它对于篇章分析、自动文摘、信息抽取、信息检索、信息过滤和机器翻译等都具有重要的意义。本文采用基于实例的动态泛化机制,在中英文上