论文部分内容阅读
随着以电子期刊和在线文档形式存在的科技文献的不断增加,对科研教学人员来讲,如何充分利用现有的网络信息资源,从庞杂的电子文档中及时、准确地获知与自己研究领域相关的最新科技信息就显得非常必要。对于科教人员这一特定群体来讲,其信息需求倾向会在相当长一段时间内围绕一个主题基本保持不变,所以他们会长期关注某类信息的发展动态。因此,根据用户个人一贯的兴趣,将用户真正感兴趣的信息主动提供给他,而尽量屏蔽那些不为用户喜欢的信息,使之能够真正做到“各得所需”,这正是个性化推荐系统的特征所在。
个性化推荐技术中用户需求信息的获取与学习、用户需求的描述文件的表达与更新、资源描述文件的表达、个性化推荐技术是关键。
在建立用户兴趣模型时,需要对代表用户兴趣的中图分类号进行挖掘,由于传统的Apriori数据挖掘算法更适合于处理无序的集合,而中图中的号码是有序的,我们提出了一种改进的算法来自动构建用户兴趣模型,从理论上来说,这也是属于基于本题的特征抽取技术。
据此基础,我们从工程的角度,根据实际需求,我们设计了整个系统的架构,以及开发了一个科技文献个性化推荐系统作为典型应用。
文章最后简要介绍了该系统的功能服务。