论文部分内容阅读
本文重点讨论如何在流数据挖掘的基础上设计和实现为用户提供高质量推荐服务的个性化推荐系统。通过使用流数据上频繁模式挖掘方法处理 Web 流数据,个性化推荐系统可以更及时地把握用户访问行为的变化,为用户更好更快地提供推荐信息。
通过研究流数据上的频繁模式挖掘,我们发现在挖掘过程中存在着模式数量较多的问题,针对这个问题,本文提出了使用无损信息压缩的频繁模式,闭合频繁模式进行挖掘。文中我们对流数据上闭合频繁模式挖掘算法 Moment 算法进行了研究,针对其中存在扫描次数过多等问题,对算法存储结构 CET 的提出了改进的更新方法和 Moment 算法的批处理和增量操作方法,改进的 Moment 算法能够以较好的时空效率对流数据进行挖掘,获得闭合频繁模式。
本文设计并实现了一种基于流数据挖掘的个性化推荐系统 WPRSSD,该系统包括连接管理子系统、挖掘子系统和推荐子系统三个部分。连接管理子系统实现数据过滤、用户识别、会话识别和流数据构造的功能。流挖掘子系统实现规则预处理和规则挖掘的功能。推荐子系统应用推荐算法实现推荐结果的生成并将其输出给用户。在推荐子系统中,通过与传统基于聚类推荐算法的比较,我们提出了一种基于关联规则前项树 ARPT 的推荐算法,可以较为有效地缩短推荐结果的产生时间和提高推荐的准确率。在本文的最后,我们介绍了系统在背景项目中的实现和取得的效果。