论文部分内容阅读
随着Internet的迅猛发展和Web信息数量的急剧增加,越来越多的Internet系统开始提供个性化服务,以便为用户检索满足其需求的Web文档。但是,这些系统并没有一个良好的机制处理Internet文档组织的无序性。所以,随着Internet文档的迅速增加,如何管理搜索到的Web文档并提供个性化信息服务就成为人们目前面临的一个难题。本文提出了一个解决此问题的具体方案—将模糊神经网络与本体论的概念层次结构相结合,实现基于本体论的信息分类;通过对用户浏览行为的在线学习,完成对用户配置文件的实时修改,从而实现个性化信息服务。主要内容包括: 开发了一个具有自动构造本体论功能的个性化信息服务系统构架,实现了Web信息的自动分类和个性化信息服务; 提出一个利用Internet文档自动构造本体论的方法。用中科院计算所的ICTCLAS汉语词法分析系统实现中文分词及标引,并用数据挖掘算法提取文档特征词条,然后利用本文提出的虚拟概念的思想,将所有特征词条组织成更有意义的概念,最后,根据概念间的继承关系,建立领域自适应概念层次结构,实现了本体论的自动构造。此方法适用于构造所有领域的本体论,具有较大的实用价值; 设计一个将模糊神经网络与本体论的概念层次结构相结合的Web文档分类系统。在本文提出的结构中,文档分类系统首先利用自动构造完成的本体论进行模糊推理,然后利用推理结果做为模糊神经网络的输入,这种方法能够减轻人工决定Web文档分类规则的工作量(目前都是由人来决定全部分类规则); 利用自适应用户配置文件提供个性化服务。本文提出的自适应用户配置文件也是基于具有强化学习能力的模糊神经网络。使用者的浏览记录包括:浏览频率、浏览时间与浏览顺序。利用这些浏览记录,通过指定的推理机制转换为在线学习的输入,借以跟踪用户行为的变化。因此系统可以动态调整用户配置文件以便最大限度地满足用户的需求。