Web使用挖掘研究及其在科学数据库门户中的应用

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:hu_20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学数据库经过二十多年的发展,积累了大量的数据资源。随着网络技术的发展和科学研究的进步,科学数据库将成为科研工作的基础设施之一,并将成为未来科学研究必不可缺的资源。作为中科院科学数据库系统的运行、管理和技术支撑单位,从整体上把握各个科学数据库的实际使用情况以及用户对各个数据库的访问模式,保证各个数据库的高效数据服务是科学数据库中心的主要任务之一,同时也是高层管理人员急需掌握的内容。   本文从科学数据库门户网站的自身特点出发,利用数据挖掘等先进技术对大量的用户访问信息进行深入的处理和分析,挖掘用户的访问模式、分析用户的访问途径,为高层管理人员从整体上把握科学数据库的访问情况,了解用户的行为模式,掌握各个科学数据库之间的关联性提供科学依据。   本文首先简要地介绍了研究背景和研究目标,然后对数据挖掘技术进行了基本概述;接着介绍了Web挖掘及其分类并对Web使用挖掘的相关情况进行了阐述;然后对基于科学数据库门户网站的Web使用挖掘的总体流程及关键技术进行了详细说明,并对各个阶段的处理结果进行了分析;接下来对用户访问途径分析中的关键技术进行了阐述,包括对各种搜索引擎的调研和对各搜索引擎来源进行统计分析;最后是总结和对下一步研究工作的展望。   本文的研究成果主要体现在,利用数据挖掘技术对科学数据库门户网站的用户访问信息进行深入分析,掌握了用户对各个科学数据库的访问模式,揭示了科学数据库之间的关联性;对用户的访问途径进行分析,了解用户从各种搜索引擎对科学数据库门户网站的访问,为改进网站的内容,提高网站的权威性提供了科学依据。
其他文献
XML的广泛流行很大程度得益于可以使用模式限制XML文档的结构.静态类型化XML处理语言利用模式增加基于XML信息系统的鲁棒性和运行效率.   在编译时刻类型检查时,静态类型化
学位
软件包管理系统是操作系统中的重要组成部分,随着开源软件运动的开展,开源软件包的数量正在以指数级的速度增长,如何正确而有效地对软件包进行管理已经成为当前操作系统研究方面
学位
蛋白质相互作用(Protein-Protein Interaction,PPI)网络是生命有机体内的所有蛋白质间相互作用组成的网络,利用计算方法在PPI网络中检测功能模块是生物信息学中一项重要的研
矩阵计算在科学计算和其它很多的领域中有着广泛的应用。LAPACK是一款线性代数函数库,它实现了线性代数计算中的大部分操作,包括矩阵分解、线性方程求解、最小二乘问题和矩阵特
学位
目前部分国内企业已经建立起一系列计算机应用系统,在运营过程中这些系统暴露出一些问题,如这些系统彼此孤立、互操作性差,数据难以得到综合分析和利用,缺乏动态捕捉市场机会、及
学位
学位
目前基于UWB(超宽带技术)的短距无线通信中,其国际标准协议IEEE 802.15.3a仅涉及到微微网(piconet)内的通信,范围局限于单个微微网和有限的设备之间.这样的网络结构显然无法
JNDI服务是Web应用服务器的核心支撑服务,在中间件系统平台中处于非常重要的地位。本文从分析Web应用服务器对于名字服务的需求和现有JNDI服务的不足入手,在J2EE1.4规范的基础
学位
A管理模式是我国较先进的企业管理思想,在很多企业得到了实施并取得良好效果。但管理过程中的数据搜集分析和过程流转等业务功能,必须依靠软件系统的支撑才能够取得实质效果。
学位
近年来,形式化方法——即在计算机系统和软件的规范、设计和构造中使用基于数学模型和离散数学的技术的工具的方法,被广泛应用于高等级安全操作系统的开发过程中。TCSEC的B2级
学位