Web上的个性化推荐技术研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:cjc013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:文中介绍了Web上个性化推荐技术的分类、输入数据以及界面表现形式。
  关键词:个性化推荐系统;推荐算法
  中图分类号:TP751文献标识码:A文章编号:1009-3044(2010)13-3501-01
  Web Research on Personalized Recommendation
  ZHAO Zhi, LIU Chang-ming, SUN Yan
  (Computer Office, Aviation University of Air Force, Changchun 130022, China)
  Abstract: This article describes the Web Personalized Recommendation on the classification of technologies input data and interface forms.
  Key words: personalization recommendation system;recommendation algorithm
  1 概述
  进入21世纪后,随着网络的普及,Internet正在前所未有地改变着我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、电子商务等工作正变得越来越复杂。由此,如何对网络上大量的信息进行有效组织利用,帮助海量数据的拥有者们找出真正有价值的信息和知识,以指导他们的决策行为成为研究者们主要关注的热点。个性化推荐就在这样的背景下产生出来,它是在Internet出现后产生的数据挖掘的一个新的分支,主要研究在Internet网络上,对各种数据源,如Web日志、用户登记信息、页面内容等,利用数据挖掘技术寻找网络上数据间各种隐含的知识模式和获取一些测试信息。把Web数据挖掘用于个性化推荐,可以帮助指导站点改进服务、调整结构和实施有针对性的商业行为,以更好地满足访问者的需求。
  2 推荐系统的分类
  (1) 非个性化推荐:推荐主要基于其它客户对该产品的评价。电子商务推荐系统对每个用户产生的推荐都是相同的。这种推荐系统可以基于Web站点工作人员的手工推荐,可以基于统计分析技术等。
  (2) 基于产品属性的推荐:推荐主要是基于产品的属性。该系统需要客户输入他所需要产品的属性,因此推荐是手工产生的。基于产品属性的推荐也可以是瞬时的或个性化的,这取决于电子商务网站是否保存有客户偏好的记录。
  (3) 相关性产品推荐:推荐系统根据客户感兴趣的产品推荐相关的产品,由于它不需要客户购买产品的历史记录,只需了解客户当前选择的产品,因此是瞬时的。如果推荐系统产生的推荐是基于客户长期较少改变的购买模式,可以认为它是自动的,如果需要客户明确输入一些感兴趣的产品后产生推荐,可以认为它是手工。
  (4) 相关性客户推荐:又称协作过滤或社会过滤。它考虑了用户的评价信息,根据客户与其他已经购买了商品的客户之间的相关性进行推荐。
  3 关键技术
  目前存在着许多个性化服务系统[1],它们提出了各种思路以实现个性化服务。个性化服务系统根据其所采用的推荐技术可以分为两种:基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协同过滤系统[2]。
  3.1 基于规则的技术
  基于规则的系统它们允许系统管理员根据用户的静态特征和动态属性来制定规则,规则可以由用户定制,也可以利用基于关联规则的挖掘技术来发现,利用规则来推荐信息依赖于规则的质量和数量,一个规则本质上是一个If-Then语句,规则决定了在不同的情况下如何提供不同的服务。
  基于规则的系统一般分为 3 部分:关键词层、描述层和用户接口层。关键词层提供上层描述所需的关键词,并定义关键词间的依赖关系,在该层可以定义静态属性的个性化规则。描述层定义用户描述和资源描述,由于描述层是针对具体的用户和资源,所以描述层的个性化规则是动态变化的。用户接口层提供个性化服务,根据下面两层定义的个性化规则将满足规则的资源推荐给用户。
  3.2 信息过滤技术
  信息过滤,也就是所谓的信息的选择性传播。与信息检索不同,信息过滤关注用户的长线需求(指在一段时间内,比较固定的信息需求),是为非结构化及半结构化的数据设计的,主要用来处理文本信息。其目标是帮助用户处理大量的信息,对动态的信息流进行筛选,着重于排除用户不希望得到的信息。信息过滤技术可分为基于内容过滤的技术和协同过滤技术。
  3.2.1 内容过滤
  基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源,假定每个用户的操作都是相互独立的,因此过滤的结果仅仅依赖于用户信息需求模型(也称用户模板)与文本的匹配程度。基于内容过滤的基本问题包括用户兴趣的建模与更新以及相似性计算方法。
  基于内容过滤的系统其优点是简单、有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。
  3.2.2 协同过滤
  迄今为止在个性化推荐系统中,协同过滤技术是应用最成功的技术。协同过滤,又称社会过滤[3],它是基于这样的假设:为一用户找到他真正感兴趣内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。它们利用用户之间的相似性来过滤信息。它一般采用基于近邻用户的协同过滤技术,核心问题是为当前用户寻找 k 个最相似的邻居来预测当前用户的兴趣。
  目前有许多网站采用了该技术的推荐系统如:Amazon.com互联网上最大的书店;CDNow.com Web上最大的CD商店;MovieFinder.com互联网上最大访问量之一的电影网站等。由微软研究院开发的协同过滤工具已被集成在微软的Commerce Server产品中,并被许多站点使用。
  参考文献:
  [1] Pretschner, A. Ontology based personalized search [MS. Thesis]. Lawrence, KS:University of Kansas, 1999.
  [2] 曾春,邢春晓,周立柱. 个性化服务技术综述. 软件学报. 2002,13(10):1952-1960.
  [3] Resnick, P. and Varian, H. Recommender systems. Communications of ACM,1997, 40(3):pp. 56-58.
其他文献
《沉思录》是被温家宝总理至少研读了一百遍的枕边书,也是美国前总统克林顿坦言除了《圣经》以外对他影响最大的一本书,是古罗马帝国的“哲学皇帝”马可·奥勒留·安东
该文简要论述了个人日历的开发意义和背景,详细介绍了个人日历的主要功能:按日期对事务的添加.删除和提醒,按时间和按内容的对事务查询功能等。该文还介绍了整个开发流程包括需求
为有助于人们深入研究关联规则挖掘技术,该文给出了关联规则及其相关术语的定义,阐述了关联规则Apriori算法,总结了经典算法的优化方案以及关联规则在经典算法基础上的扩展应
期刊
在中国科协、农业部等单位的大力支持下中国畜牧兽医学会主办的2007年第15届世界禽病学会(WVPA)大会于2007年9月11~15日在中国北京隆重召开。与会议代表1100人,来自世界50多个国
目的:探讨康复护理干预在脊髓损伤患者神经源性膀胱功能转归的作用。方法:对68例脊髓损伤后神经源性膀胱患者分为对照组和观察组,对照组行常规护理,观察组在常规护理的基础上行
附红细胞体病(Eperythrozoonsis)是近几年来才引起医学和畜牧兽医工作者注意的一种人畜共患病。近年来我国报道了猪、牛、羊、猫、兔、犬、鸡、人附红细胞体病的发生,给我国畜牧
在分析模糊神经网络的模型、系统结构和学习算法的基础上,提出了基于自适应神经模糊推理系统(ANFIS)的自适应噪声抵消算法,并对算法进行了仿真和分析.仿真结果表明,在合理选取
1 高产奶牛及其营养特点1.1 高产奶牛根据中华人民共和国<高产奶牛饲养管理规范>,高产奶牛的定义为:305天产奶量6 000千克以上,含脂率3.4%(或与此相当的乳脂量)的牛群或个体
湖南常德西洞庭管理区养鸭户黄某养殖肉鸭共5000余只,分两群饲养,30日龄以内3000余只,2千克左右鸭的2000余只.两群的鸭舍与运动场均用渔网隔开.采用市售鸭颗粒饲料饲喂.3月份