论文部分内容阅读
随着计算机技术的迅速发展,网络上的信息越来越丰富,电子期刊和在线文档形式存在的科技文献正在不断增加。对科研教学人员来讲,如何充分利用现有的网络信息资源,从庞杂的电子文档中及时、准确地获知与自己研究领域相关的最新科技信息就显得非常必要。对于科教人员这一特定群体来讲,其信息需求倾向会在相当长一段时间内围绕一个主题基本保持不变,将用户真正感兴趣的信息主动提供给他,而尽量屏蔽那些不为用户喜欢的信息,使之能够真正做到“各得所需”,这正是个性化推荐系统的特征所在。
信息过滤技术是个性化推荐系统的基础和核心部分,也是作为信息系统集成中一个极为重要的组成部分。个性化推荐技术中,用户需求信息的获取与学习、用户需求的描述文件的表达与更新、资源描述文件的表达等是问题的关键。
本文提出了一种对代表用户兴趣的中图分类号进行充分挖掘的并结合用户长期和短期兴趣的用户兴趣模型。由于传统的基于内容和协同过滤技术各有利弊,根据本系统资源和用户的特征,我们提出了一种用户分类算法来自动构建用户兴趣模型,并且进一步提出了一种混合过滤技术。采用改进的互关联后继树模型和多库合并建库算法,可以更好的管理数字图书馆的资源。
此外,根据Deep Web的理论和实际需求的变化,我们重新调整了整个系统的架构,进一步优化了原有个性化推荐系统。