论文部分内容阅读
随着网络的快速发展,网络上存在的信息资源也迅速增长,传统的检索结果以线性列表的形式返回,缺乏有效的过滤、组织和汇聚,无法很好地体现文档之间存在的内在关联,而且展示方式单一,在检索结果浏览过程中不能提供灵活的人机交互。
信息检索可视化可以利用丰富的视觉表现形式实现与用户的交互,帮助用户理解信息之间的关系。但是目前可视化也存在着一些问题:如用户在可视化展示形式上的选择性不强;文档之间的关系体现不够充分;全局可视化展示和局部可视化展示结合不够等等。
针对上述问题,本文对WWW信息检索可视化进行了研究,并以网络上的信用信息资源为对象开展应用。研究内容主要包括如下几个方面:
(1)按照信息可视化参考模型的处理过程,确定信用信息特征和可视化对象,根据信用信息的数据类型选择合适的数据转换方法,采用分析工具提取页面数据中的有用信息进行存储。
(2)采用基于自组织图SOM的自组织特征映射算法,利用信用主题词库将检索到的文档集,通过SOM聚类处理可视化映射成特征图,并对特征图进行主题区域的确定,揭示隐含在文档中的信息之间的关系。
(3)开展WWW信用信息检索结果展示方法的研究。采用全局可视化展示和局部可视化展示相结合的方式显示信用信息的特点和关联关系,在全局可视化展示方式上采用树形结构和图形结构来体现信息的分布全貌和聚类特性,在局部可视化展示上采用节点连接图来体现所选信息集在关键字上的关联关系。
(4)采用上述的信用信息特征的数据转换方法、可视化映射方法及展示方式,设计和实现WWW信用信息检索可视化的原型系统。