论文部分内容阅读
随着网络技术与通信技术的蓬勃发展,一个信息资源急剧膨胀的时代已经到来。这些资源为人们提供大量的信息,成为生活中不可或缺的部分,但是这些信息带有明显的分布性、自治性和异构性,从而导致“信息过载”、“信息迷航”、“信息孤岛”等问题的出现,这在一定程度上阻碍人们快速准确地获取信息。传统的查询系统和信息服务模式对这些异构信息的查询已经是心有余而力不足:呆板的查询机制使得查询的结果往往只有“广度”而没有“深度”,词汇的同形异义和同义异形使得查询结果存在大量的重复信息甚至是垃圾信息。产生这些查询结果的原因可以归结为传统的查询系统无法从语义上来理解用户的查询意图。因此,当一种描述语义级别信息的技术,即本体技术出现后,具有针对性的语义级别的查询机制——个性化语义查询,便可以用来解决前述信息查询、共享的瓶颈问题。
本文在信息集成系统的基础上,参考现有的个性化查询实现方式,构思一个基于角色偏好本体的个性化语义查询系统,以在语义级别实现用户的个性化查询需求。作为领域模型,本体提供了人们对领域概念和概念层次的共同理解。主要研究内容包括:①在信息集成系统的大背景下,给出本文的基于本体的个性化语义查询系统框架,实现用户语义级别的个性化查询。②将传统的计算关键词重要性的TF×IDF经典方法扩展到本体概念权重值计算中,用以计算用户兴趣偏好的概念权重,完成用户角色偏好本体(偏好文件中的特定偏好)的自维护。在此基础上对原有算法进行改进,并用相应的实验证明算法的合理性和有效性。③在概念相似度的基础上,提出偏好相似度和查询相似度的概念,并引用cosine相似度计算方法,计算概念间的相似度,实现查询结果的个性化。并用相应的实验证明算法的可行性。④将前述两种算法应用到个性化语义查询系统原型中,完成原型系统中偏好权重值的计算,实现用户查询结果的个性化,并给出相应的实验结果。