论文部分内容阅读
摘要:文中介绍了Web上个性化推荐技术的分类、输入数据以及界面表现形式。
关键词:个性化推荐系统;推荐算法
中图分类号:TP751文献标识码:A文章编号:1009-3044(2010)13-3501-01
Web Research on Personalized Recommendation
ZHAO Zhi, LIU Chang-ming, SUN Yan
(Computer Office, Aviation University of Air Force, Changchun 130022, China)
Abstract: This article describes the Web Personalized Recommendation on the classification of technologies input data and interface forms.
Key words: personalization recommendation system;recommendation algorithm
1 概述
进入21世纪后,随着网络的普及,Internet正在前所未有地改变着我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、电子商务等工作正变得越来越复杂。由此,如何对网络上大量的信息进行有效组织利用,帮助海量数据的拥有者们找出真正有价值的信息和知识,以指导他们的决策行为成为研究者们主要关注的热点。个性化推荐就在这样的背景下产生出来,它是在Internet出现后产生的数据挖掘的一个新的分支,主要研究在Internet网络上,对各种数据源,如Web日志、用户登记信息、页面内容等,利用数据挖掘技术寻找网络上数据间各种隐含的知识模式和获取一些测试信息。把Web数据挖掘用于个性化推荐,可以帮助指导站点改进服务、调整结构和实施有针对性的商业行为,以更好地满足访问者的需求。
2 推荐系统的分类
(1) 非个性化推荐:推荐主要基于其它客户对该产品的评价。电子商务推荐系统对每个用户产生的推荐都是相同的。这种推荐系统可以基于Web站点工作人员的手工推荐,可以基于统计分析技术等。
(2) 基于产品属性的推荐:推荐主要是基于产品的属性。该系统需要客户输入他所需要产品的属性,因此推荐是手工产生的。基于产品属性的推荐也可以是瞬时的或个性化的,这取决于电子商务网站是否保存有客户偏好的记录。
(3) 相关性产品推荐:推荐系统根据客户感兴趣的产品推荐相关的产品,由于它不需要客户购买产品的历史记录,只需了解客户当前选择的产品,因此是瞬时的。如果推荐系统产生的推荐是基于客户长期较少改变的购买模式,可以认为它是自动的,如果需要客户明确输入一些感兴趣的产品后产生推荐,可以认为它是手工。
(4) 相关性客户推荐:又称协作过滤或社会过滤。它考虑了用户的评价信息,根据客户与其他已经购买了商品的客户之间的相关性进行推荐。
3 关键技术
目前存在着许多个性化服务系统[1],它们提出了各种思路以实现个性化服务。个性化服务系统根据其所采用的推荐技术可以分为两种:基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协同过滤系统[2]。
3.1 基于规则的技术
基于规则的系统它们允许系统管理员根据用户的静态特征和动态属性来制定规则,规则可以由用户定制,也可以利用基于关联规则的挖掘技术来发现,利用规则来推荐信息依赖于规则的质量和数量,一个规则本质上是一个If-Then语句,规则决定了在不同的情况下如何提供不同的服务。
基于规则的系统一般分为 3 部分:关键词层、描述层和用户接口层。关键词层提供上层描述所需的关键词,并定义关键词间的依赖关系,在该层可以定义静态属性的个性化规则。描述层定义用户描述和资源描述,由于描述层是针对具体的用户和资源,所以描述层的个性化规则是动态变化的。用户接口层提供个性化服务,根据下面两层定义的个性化规则将满足规则的资源推荐给用户。
3.2 信息过滤技术
信息过滤,也就是所谓的信息的选择性传播。与信息检索不同,信息过滤关注用户的长线需求(指在一段时间内,比较固定的信息需求),是为非结构化及半结构化的数据设计的,主要用来处理文本信息。其目标是帮助用户处理大量的信息,对动态的信息流进行筛选,着重于排除用户不希望得到的信息。信息过滤技术可分为基于内容过滤的技术和协同过滤技术。
3.2.1 内容过滤
基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源,假定每个用户的操作都是相互独立的,因此过滤的结果仅仅依赖于用户信息需求模型(也称用户模板)与文本的匹配程度。基于内容过滤的基本问题包括用户兴趣的建模与更新以及相似性计算方法。
基于内容过滤的系统其优点是简单、有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。
3.2.2 协同过滤
迄今为止在个性化推荐系统中,协同过滤技术是应用最成功的技术。协同过滤,又称社会过滤[3],它是基于这样的假设:为一用户找到他真正感兴趣内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。它们利用用户之间的相似性来过滤信息。它一般采用基于近邻用户的协同过滤技术,核心问题是为当前用户寻找 k 个最相似的邻居来预测当前用户的兴趣。
目前有许多网站采用了该技术的推荐系统如:Amazon.com互联网上最大的书店;CDNow.com Web上最大的CD商店;MovieFinder.com互联网上最大访问量之一的电影网站等。由微软研究院开发的协同过滤工具已被集成在微软的Commerce Server产品中,并被许多站点使用。
参考文献:
[1] Pretschner, A. Ontology based personalized search [MS. Thesis]. Lawrence, KS:University of Kansas, 1999.
[2] 曾春,邢春晓,周立柱. 个性化服务技术综述. 软件学报. 2002,13(10):1952-1960.
[3] Resnick, P. and Varian, H. Recommender systems. Communications of ACM,1997, 40(3):pp. 56-58.
关键词:个性化推荐系统;推荐算法
中图分类号:TP751文献标识码:A文章编号:1009-3044(2010)13-3501-01
Web Research on Personalized Recommendation
ZHAO Zhi, LIU Chang-ming, SUN Yan
(Computer Office, Aviation University of Air Force, Changchun 130022, China)
Abstract: This article describes the Web Personalized Recommendation on the classification of technologies input data and interface forms.
Key words: personalization recommendation system;recommendation algorithm
1 概述
进入21世纪后,随着网络的普及,Internet正在前所未有地改变着我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、电子商务等工作正变得越来越复杂。由此,如何对网络上大量的信息进行有效组织利用,帮助海量数据的拥有者们找出真正有价值的信息和知识,以指导他们的决策行为成为研究者们主要关注的热点。个性化推荐就在这样的背景下产生出来,它是在Internet出现后产生的数据挖掘的一个新的分支,主要研究在Internet网络上,对各种数据源,如Web日志、用户登记信息、页面内容等,利用数据挖掘技术寻找网络上数据间各种隐含的知识模式和获取一些测试信息。把Web数据挖掘用于个性化推荐,可以帮助指导站点改进服务、调整结构和实施有针对性的商业行为,以更好地满足访问者的需求。
2 推荐系统的分类
(1) 非个性化推荐:推荐主要基于其它客户对该产品的评价。电子商务推荐系统对每个用户产生的推荐都是相同的。这种推荐系统可以基于Web站点工作人员的手工推荐,可以基于统计分析技术等。
(2) 基于产品属性的推荐:推荐主要是基于产品的属性。该系统需要客户输入他所需要产品的属性,因此推荐是手工产生的。基于产品属性的推荐也可以是瞬时的或个性化的,这取决于电子商务网站是否保存有客户偏好的记录。
(3) 相关性产品推荐:推荐系统根据客户感兴趣的产品推荐相关的产品,由于它不需要客户购买产品的历史记录,只需了解客户当前选择的产品,因此是瞬时的。如果推荐系统产生的推荐是基于客户长期较少改变的购买模式,可以认为它是自动的,如果需要客户明确输入一些感兴趣的产品后产生推荐,可以认为它是手工。
(4) 相关性客户推荐:又称协作过滤或社会过滤。它考虑了用户的评价信息,根据客户与其他已经购买了商品的客户之间的相关性进行推荐。
3 关键技术
目前存在着许多个性化服务系统[1],它们提出了各种思路以实现个性化服务。个性化服务系统根据其所采用的推荐技术可以分为两种:基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协同过滤系统[2]。
3.1 基于规则的技术
基于规则的系统它们允许系统管理员根据用户的静态特征和动态属性来制定规则,规则可以由用户定制,也可以利用基于关联规则的挖掘技术来发现,利用规则来推荐信息依赖于规则的质量和数量,一个规则本质上是一个If-Then语句,规则决定了在不同的情况下如何提供不同的服务。
基于规则的系统一般分为 3 部分:关键词层、描述层和用户接口层。关键词层提供上层描述所需的关键词,并定义关键词间的依赖关系,在该层可以定义静态属性的个性化规则。描述层定义用户描述和资源描述,由于描述层是针对具体的用户和资源,所以描述层的个性化规则是动态变化的。用户接口层提供个性化服务,根据下面两层定义的个性化规则将满足规则的资源推荐给用户。
3.2 信息过滤技术
信息过滤,也就是所谓的信息的选择性传播。与信息检索不同,信息过滤关注用户的长线需求(指在一段时间内,比较固定的信息需求),是为非结构化及半结构化的数据设计的,主要用来处理文本信息。其目标是帮助用户处理大量的信息,对动态的信息流进行筛选,着重于排除用户不希望得到的信息。信息过滤技术可分为基于内容过滤的技术和协同过滤技术。
3.2.1 内容过滤
基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源,假定每个用户的操作都是相互独立的,因此过滤的结果仅仅依赖于用户信息需求模型(也称用户模板)与文本的匹配程度。基于内容过滤的基本问题包括用户兴趣的建模与更新以及相似性计算方法。
基于内容过滤的系统其优点是简单、有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。
3.2.2 协同过滤
迄今为止在个性化推荐系统中,协同过滤技术是应用最成功的技术。协同过滤,又称社会过滤[3],它是基于这样的假设:为一用户找到他真正感兴趣内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。它们利用用户之间的相似性来过滤信息。它一般采用基于近邻用户的协同过滤技术,核心问题是为当前用户寻找 k 个最相似的邻居来预测当前用户的兴趣。
目前有许多网站采用了该技术的推荐系统如:Amazon.com互联网上最大的书店;CDNow.com Web上最大的CD商店;MovieFinder.com互联网上最大访问量之一的电影网站等。由微软研究院开发的协同过滤工具已被集成在微软的Commerce Server产品中,并被许多站点使用。
参考文献:
[1] Pretschner, A. Ontology based personalized search [MS. Thesis]. Lawrence, KS:University of Kansas, 1999.
[2] 曾春,邢春晓,周立柱. 个性化服务技术综述. 软件学报. 2002,13(10):1952-1960.
[3] Resnick, P. and Varian, H. Recommender systems. Communications of ACM,1997, 40(3):pp. 56-58.