基于关联规则挖掘与协同过滤算法的个性化推荐系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户：mirror722

【摘要】

：

数字图书馆中存储了海量的数字资源，用户在检索这些资源的时候，往往面对过多的资源产生困惑，不知道那些资源才是他们最需要的。同时不同用户对资源的喜好和需要也是不同的。满足

【作者】

：

张静肖

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2006年期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数字图书馆中存储了海量的数字资源，用户在检索这些资源的时候，往往面对过多的资源产生困惑，不知道那些资源才是他们最需要的。同时不同用户对资源的喜好和需要也是不同的。满足用户个性化需求，为用户提供优质的个性化服务是数字图书馆信息服务发展的趋势。 “信息过载”和“个性化服务”成为当前数字图书馆建设中逐渐突出的问题。中国高等教育文献保障体系(CALIS)通过构建中国高等教育数字图书馆(CADLIS)，汇集了国内外很多数字资源，致力于为用户提供综合的一站式的个性化服务，从而提高数字图书馆服务质量。本论文作为该项目的一个子课题，通过研究和开发个性化推荐系统，使CADLIS门户系统能为用户提供一种主动式的个性化的服务手段。个性化推荐系统通过收集和分析用户信息来学习用户的兴趣和行为，构建用户的兴趣模型，积极主动的对用户行为进行指导，帮助他们查找对他们来说最有价值的信息。本文的贡献是将关联规则挖掘与协同过滤算法相结合，提出了基于规则库查询匹配的个性化推荐系统。本文对单纯基于关联规则挖掘的方法进行了改进，在此基础上引入协同过滤中“邻居用户”概念，提出了将邻居用户关联规则以及邻居用户同目标用户之间的相似度作为生成最终目标用户规则的影响因子，从而提高了个性化推荐系统的推荐质量；同时，在构建邻居用户的时候提出了预测用户访问频数的办法，解决了构建邻居用户时的用户矢量稀疏度的问题。本文在进行系统设计和实现的过程中，重点解决了以下几个问题： 1.用户交互与隐私问题：本文利用隐式方法来构建用户模型，使推荐系统能自动跟踪用户的访问过程，从用户的访问历史数据中挖掘用户的兴趣模型。这样能避免系统与用户的交互，从而提高了用户使用推荐系统的效率和积极性，避免了用户的隐私问题。 2.大稀疏度问题：当数据集的项目很多的时候，用户的矢量模型具有很大的稀疏度。采用通常的方法来计算用户之间的相似度，所产生的邻居用户会很不准确。这是因为，用户没有访问过某一项目并不说明他/她对此项目不感兴趣。为解决这种大稀疏度问题，本文提出了预测用户访问频数的办法，即利用项目矢量之间的关系，预测用户对没有访问过的项目的可能访问频数，从而提高了生成邻居用户的准确度。 3.推荐质量问题：相似度很高的用户往往具有相似的兴趣爱好，他们所喜好的项目对于给目标用户产生推荐项目具有很高的参考价值。本文通过对邻居用户的强关联规则加权，生成新的影响因子，形成最终用户的强关联规则，从而提高了系统的推荐质量。 4.推荐服务的实时性问题：用户对于推荐系统的实时性往往有很高的要求。本文在推荐系统中采用了规则推荐的方式，产生用户推荐所需要的时间实际上就是推荐引擎到规则库中进行匹配查询的时间。这种查询时间很短，这使得系统能实时地将项目推荐给用户，避免了用户因等待较长会产生厌烦的情况。

其他文献

人乙醛脱氢酶2基因的克隆及表达

人体中的乙醇脱氢酶（alcohol dehydrogenase,ADH）及乙醛脱氢酶（aldehyde dehydrogenase,ALDH）在乙醇代谢过程中发挥着重要的作用。若ADH及ALDH在人体内均充分具备,则能较快得分解

学位

乙醇脱氢酶乙醛脱氢酶同工酶乙醇代谢底物特异性

半导体集成电路可靠性测试及数据处理方法

本文通过对荣华二采区10

期刊

新型BST可变电容特性测试与应用

BST[BaxSr(1-x)TiO3钛酸锶钡]电调可变电容是新一代电调可变电容的典型代表,其具有介质损耗低、线性调谐范围大等特点。本文结合 BST电调可变电容的特性曲线测试方法,研究BST

学位

电调可变电容钛酸锶钡介电常数压控振荡器压控灵敏度频率合成器

无线传输系统衰落特性的研究

在科学技术不断发展，国际竞争日趋激烈的今天，信息技术占据着举足轻重的地位，通信与计算机网络的发展，影响着政治、经济、军事、文化等各行各业的发展。无线通信是当代的主流

学位

多径衰落抗衰落技术MATLAB仿真误码率无线传输系统衰落特性

云南口音汉语普通话语音识别研究

让机器具有“听”、“说”人类语言的能力是人类的理想，这个理想，在信息时代正逐步变成现实。语音识别正是解决机器“听”懂人类语言的一项研究。本论文主要就具有云南地方口音

学位

语音识别云南口音声学模型语音数据库汉语普通话

ZigBee和CAN技术融合的测控系统研究与实现

研究实现了一种融合 ZigBee和 CAN技术的温度测控系统,该系统综合应用了ZigBee无线技术、CAN总线技术、计算机接口技术、嵌入式技术和软件开发技术,是促进测控技术向前发展的

学位

ZigBee无线技术CAN总线测控系统网络通信广播风暴

低密度奇偶校验码理论及应用研究

下一代移动通信系统的设计能力将远远超过当前的第三代移动通信系统的能力,其中一个最重要的特点表现在需要在20MHz的带宽内,实现高达100Mbps的数据传输。因此,在如此高的频

学位

信道编码低密度奇偶校验码理论迭代译码量化译码

基于DSP54X系列的水声通信调制技术

水声通信系统在水下防卫和民用海洋开发方面可以应用的领域非常广泛，具体主要包括潜艇与潜艇之间的双向通信、潜艇与潜艇编队之间的双向通信、侦察探测水雷及水中军事设施、遥

学位

水声通信水声信道调制技术解调技术

嵌入式无线视频监控终端中视频处理技术的研究与实现

随着多媒体技术及无线网络技术的发展,视频监控系统的应用越来越广泛。无线视频监控系统主要由视频监控终端、无线传输网络和监控客户端三个部分组成。而在视频监控终端中,视

学位

无线视频监控终端设计视频采集编码功能嵌入式技术

基于64位PCI总线的双通道遥感卫星数据采集与回放技术研究

数据记录系统是遥感卫星地面接收站系统中重要的组成部分，实时数据采集是记录系统中的关键技术环节。随着探测器和传输技术快速发展，无可置疑地对数据记录系统技术提出了更高要

学位

PCI总线遥感卫星地面接收站系统数据记录系统数据回放卫星信号模拟源

基于关联规则挖掘与协同过滤算法的个性化推荐系统的设计与实现

与本文相关的学术论文