论文部分内容阅读
互联网的蓬勃发展和人们对医疗信息资源的巨大需求促进了医疗门户网站的兴起,医疗门户网站已经成为人们了解医疗、健康等信息资源必不可少的平台。随着人们对医疗健康信息个性化需求的不断增加,医疗门户网站信息资源组织方式及分类体系也越来越成为关注的焦点。通过调研分析,目前医疗门户网站主要采用主题与学科分类方式整合组织信息资源,尽管这种信息资源组织方法具有系统性强、分类类目权威等优点,但在当前强调个性化服务的网络环境下,其表现出来的类目名称固定、格式固化、交互性较差等缺点越来越凸显。公众分类作为Web2.0时代的重要产物,在信息资源组织方面具有传统分类方法无可比拟的巨大优势,它大幅度降低了信息资源的分类成本,有效缩短了类目的更新周期,其与生俱来的语义性、标签化等特点将会对医疗门户网站信息资源的组织体系的改善产生巨大的影响。本文首先对公众分类的相关概念及特点做了详细介绍,分析了当前医疗门户网站信息资源分类的主要模式,指出了当前分类模式下存在的一些不足和面临的挑战,而公众分类在信息资源分类中的优势将有助于解决这些难题,于是提出了基于公众分类的医疗门户网站分类系统,对原有的分类体系进行系统性改进,使其信息组织体系朝着个性化、动态化方向发展,最大限度地满足用户的需求。针对如何将公众分类与传统的分类模式有机结合的问题,本文采用K-means聚类算法进行聚类整合。为了能在医疗门户网站的实际运用中取得较好的聚类效果,本文对原有算法进行了改进,将网站主题词集与标签按照相似度进行聚类研究,生成了语义性较强的主题-标签集树状结构,采用权威的评价指标体系对主题-标签树状集合进行仿真实验,验证聚类效果的优劣。