Web使用记录挖掘在数字图书馆个性化服务中的应用研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:guangtoucx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图书馆使用数字技术进行信息资源的组织和管理,能够存储海量信息。随着网络上数字图书馆越来越多,数字图书馆的数据挖掘和知识发现研究具有较大的应用价值。Web使用记录挖掘是Web数据挖掘的三个研究领域中非常重要的一个研究方向,通过分析和探究Web日志记录中的规律,可以识别潜在客户,将数据挖掘技术运用到数字图书馆中,可以增强对用户的服务质量。本文从整体介绍什么是数据仓库、数据挖掘开始,由粗而细逐一介绍了Web数据挖掘、Web使用记录挖掘以及数字图书馆个性化服务系统的相关概念和知识,尤其对Web使用记录挖掘的相关理论做了重点介绍,为后续内容奠定了理论基础。第三章对数字图书馆个性化服务中数据仓库的搭建及使用记录挖掘过程作了详细介绍,利用数据挖掘软件clementine以及sqlserver2005,oracle数据库,对使用记录进行挖掘:从挖掘工具与数据库的选择,到数据仓库的搭建以及使用记录挖掘过程。根据CRISP-DM标准挖掘流程图提出了一套适合使用记录挖掘的流程图,并根据这个流程图,进行数据收集、数据理解、数据准备、模式挖掘、模式分析等操作。在数据准备阶段又依次划分为数据清理、用户识别、会话识别、路径完整4个阶段,在每个阶段中都提出了各自的算法及用clementine具体挖掘过程。用户识别阶段,提出了一个基于用户IP、登陆时间、网站的拓扑图、引用网页和Agent来识别出单个用户的新的算法。第四章主要是对第三章的挖掘过程进行实验,以黑龙江大学图书馆网站为例,挖掘用户使用模式,分析及评价所挖掘出来的模型。并对用户识别阶段提出的算法进行测试与比较。第五章为论文的结束部分,对论文进行了总结,指出了本文的创新点及不足以及进一步研究的几点设想。
其他文献
Al-Si-Cu-Mg系铸造铝合金具有较高的力学性能及良好的铸造性能,其优良的综合性能使其应用非常广泛,已成为装备制造业中最受重视的结构材料之一。随着航空工业和汽车工业的迅
量词是汉语学习的难点,是留学生学习汉语时出现偏误最多的词类之一。本文选择对外汉语量词教学作为研究点,对对外汉语量词教学的现状作一简单的梳理。
苏夏和陆在易分别是我国20世纪上半叶和当代在中国艺术歌曲创作领域卓有成就的两位作曲家,为我国艺术歌曲的发展都作出了突出的贡献。笔者出于对我国艺术歌曲的热爱,对这两位
在使用单波长荧光分光光度计测定细胞内游离钙浓度时,通过快速(4~6s)手动转换激发波长(EX),分别测定EX340和380nm时的荧光强度变化,并计算出340nm与380nm时的荧光强度比率(R),然后也采用双波长荧光分光光度计测定细
<正> 慢性萎缩性胃炎(下称CAG)是一种常见的消化系统疾病,临床多表现为胃痛、痞满、纳差、暖气、乏力等症状,在慢性胃炎中占30%左右,中年以上患者较为多见。本病常伴有肠上皮
新课改的教材观:用教材教,而非教教材。因此教师可以灵活、合理地使用教材,彻底打开教材这个压缩文件包。面对语文教材可从以下几方面入手:一、让生活走进教材;二、让历史走
目的探索兔深静脉血栓的建模方法。方法采用暂时阻断血流、损伤血管内皮、注入凝血酶及术后肢体固定的方法制作动物模型。于造模后48h进行彩色多普勒超声及病理检测。结果 8
企业的兴衰与人才的素质有着密切关系,任何一个企业都渴望拥有自己所需要的人才,加入WTO后,企业更需要人才。如何培养人才,最重要的是要有一个出人才的机制。以前我们每年都要到
瑟吉欧·莱昂内是意大利西部片的先驱与集大成者,其擅长以悠扬回旋、跌宕铿锵以及纵横交织的背景配乐来增强影片的整体表现力,继而也使得其凌厉洒脱、曲折畅快的电影风格激越
姬塬油田G271区长X油藏2010~2011年规模建产,为超低渗透油藏,采用菱形反九点井网超前注水开发,注水后高低渗透区的吸水指数差异大,注入水很容易沿高渗带突进,导致沿裂缝线方向