基于流数据挖掘的个性化推荐系统的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:qq343246680
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文重点讨论如何在流数据挖掘的基础上设计和实现为用户提供高质量推荐服务的个性化推荐系统。通过使用流数据上频繁模式挖掘方法处理 Web 流数据,个性化推荐系统可以更及时地把握用户访问行为的变化,为用户更好更快地提供推荐信息。 通过研究流数据上的频繁模式挖掘,我们发现在挖掘过程中存在着模式数量较多的问题,针对这个问题,本文提出了使用无损信息压缩的频繁模式,闭合频繁模式进行挖掘。文中我们对流数据上闭合频繁模式挖掘算法 Moment 算法进行了研究,针对其中存在扫描次数过多等问题,对算法存储结构 CET 的提出了改进的更新方法和 Moment 算法的批处理和增量操作方法,改进的 Moment 算法能够以较好的时空效率对流数据进行挖掘,获得闭合频繁模式。 本文设计并实现了一种基于流数据挖掘的个性化推荐系统 WPRSSD,该系统包括连接管理子系统、挖掘子系统和推荐子系统三个部分。连接管理子系统实现数据过滤、用户识别、会话识别和流数据构造的功能。流挖掘子系统实现规则预处理和规则挖掘的功能。推荐子系统应用推荐算法实现推荐结果的生成并将其输出给用户。在推荐子系统中,通过与传统基于聚类推荐算法的比较,我们提出了一种基于关联规则前项树 ARPT 的推荐算法,可以较为有效地缩短推荐结果的产生时间和提高推荐的准确率。在本文的最后,我们介绍了系统在背景项目中的实现和取得的效果。
其他文献
摘要:太阳能是一种具有对环境污染最小和二氧化碳排放最低的可再生能源。为了避免能源危机,人们将更多的使用太阳能。因此,估算太阳能发电厂所产生的电量是很有意义的。近几年
在网格环境中,资源是异构的、分散的,大量地理上分布的资源为不同的组织所拥有。由于这些组织具有不同的使用规则、不同的计费模型和不一样的负荷能力,构造具有集中的资源管理和
Web服务选择是Web服务中重要的组成部分。传统的Web服务选择只是简单的基于关键字的语法匹配,查询得到的服务包含了大量用户需求的以外的大量的垃圾服务,导致搜索的用户体验很
随着数字化医疗的发展,医疗机构每天产生大量医学诊断相关数据,如何充分利用、挖掘这些数据中包含的重要知识,以辅助医生作出快速、准确的诊断,已经成为当今亟待解决的问题。此外
电子商务环境包括多方之间利用电子技术进行的所有在线活动和业务运营,随着互联网和电子商务网站的巨大发展,当消费者选择他们所需物资和商品时,他们面临着严重的数据重载问题。
网格技术源于20世纪90年代的美国政府的分布式超级计算项目Ⅰ-WAY。网格把分布在不同地点的、不同单位的、不同计算节点的各种计算和信息服务资源,例如计算能力、存储能力和信
当今时代是网络的时代,网络在社会中的作用越来越明显。人们对网络的依赖和需求也随之增多,对网络所提供服务的要求越来越高。学习计算机网络的基本知识就显得尤为重要。为了
随着社会的发展,对计算能力的要求越来越高,网格计算的应用范围也就越来越广泛。此外,由于网格的动态性、分布性和异构性等特点导致网格资源管理和网格任务调度面临着巨大的挑战
作为一种共享异构数据源的途径,数据集成系统有着广泛的应用需求。模式映射是数据集成系统的重要组成,通常由视图定义(查询)语言表示,它描述了不同模式之间的数据是如何转换的,是
随着Internet的迅速发展和普及,用户要求更广泛的、更普遍的资源共享。P2P网络具有分布式的特性并且能够充分利用资源,成为业界研究与关注的焦点。但是,P2P网络缺乏集中控制的特