论文部分内容阅读
图书馆和各类文献信息服务中心都是用户获取高质量的文献信息的首选机构。数字信息时代,越来越多用户通过互联网访问的方式获取科技文献信息,可获取的用户信息行为数据越来越丰富。文献检索、文献浏览和文献获取等一系列的信息行为中,蕴含了丰富的用户行为习惯信息和兴趣偏好信息。本文旨在通过研究科技文献信息用户的信息行为特征,构建科技文献用户画像标签体系,并利用国家科技图书文献中心网络服务系统的用户数据进行实证研究。 首先,本文通过对相关文献的阅读、分析和研究,介绍了用户画像的起源与国内外用户画像的研究现状,包括用户画像的构建方式、构建流程、应用场景以及相关的数据隐私和数据安全问题。 其次,结合经典的用户信息需求理论与用户信息行为模型,深入剖析了用户信息行为特征以及影响用户信息行为的因素,并构建了科技文献信息用户画像的三层标签体系。之后阐述了科技文献信息用户画像构建过程中的关键技术,包括用户识别、会话识别、用户分群聚类、研究主题挖掘等。 最后,以国家科技图书文献中心网络服务平台的注册用户信息以及2017年用户访问日志为实验数据,利用K-MEANS聚类算法对用户聚类,总结每类用户的特征并选择合适的类名,然后基于科技文献信息用户画像的三层标签体系,选取每类用户中的一个用户,计算该用户各类标签的值或内容,构建其用户画像,利用文字和图形展示用户画像的结果。对用户画像结果的分析表明,本文构建的科技文献信息用户的三层标签体系能够较为全面地反映用户的全貌。