论文部分内容阅读
众所周知,因特网的迅速普及,推进了全球信息化的建设,与此同时也正深刻的改变着人们的生活和思维方式。因特网作为人们信息获取不可或缺的来源,由于其缺乏统一的组织和管理,网上的资源漫无头绪,再加上WEB站点的数量及内容时刻都在变化,导致了过量的信息和人们有限的信息获取能力形成了对矛盾,出现了“信息过载”和“信息迷向”的问题。对此人们提出了个性化的信息服务,个性化的信息服务作为一种新的信息服务方式,可以提高资源的利用率和获取效率,满足人的个性化的需求。随着个性化服务的发展和研究的深入,人们逐渐意识到个性化服务的质量不仅仅取决于具体的推荐技术、检索技术等,还取决于用户兴趣和偏好等特点的可计算性描述,而后者尤其重要。作为个性化服务的基础和核心—用户兴趣模型成为了人们研究的一个热点课题,但是一直以来没有一个明确的标准,各种建模方法针对用户的信息来源、获取方式、表示方法、兴趣粒度、更新机制、模型的共享与重用性等多角度做了深入的研究,各有优缺点。本文在通过对用户兴趣建模所涉及到的人工智能、机器学习、神经网络、粗糙集理论、数据挖掘等众多方面和领域进行了深入了解的基础上,从目前用户兴趣模型的构建形式、信息获取、表示、更新、评价几个角度进行了分析,提出了利用概念语义空间、本体论构建基于概念语义的用户兴趣模型和建模方法。模型采用概念层次树与概念集合相结合的方式表述用户兴趣模型。在模型的构建过程中,首先根据本体论与中图法建立领域概念层次树,然后采用示例学习生成概念层次树各分枝的规范化表示,这种规范化表示是由概念集合来表述的。通过挖掘蕴含在用户反馈文档中的概念及概念间的语义关系,来捕获和表达用户的兴趣和偏好。实验证明,与传统向量空间模型的基于关键词、词频的方式相比,基于概念语义的用户兴趣模型能够更加准确的定位用户的信息,更具有共享和重用性、更能够提高用户兴趣模型的性能。