科技文献信息用户画像构建

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:yjddstevens
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图书馆和各类文献信息服务中心都是用户获取高质量的文献信息的首选机构。数字信息时代,越来越多用户通过互联网访问的方式获取科技文献信息,可获取的用户信息行为数据越来越丰富。文献检索、文献浏览和文献获取等一系列的信息行为中,蕴含了丰富的用户行为习惯信息和兴趣偏好信息。本文旨在通过研究科技文献信息用户的信息行为特征,构建科技文献用户画像标签体系,并利用国家科技图书文献中心网络服务系统的用户数据进行实证研究。  首先,本文通过对相关文献的阅读、分析和研究,介绍了用户画像的起源与国内外用户画像的研究现状,包括用户画像的构建方式、构建流程、应用场景以及相关的数据隐私和数据安全问题。  其次,结合经典的用户信息需求理论与用户信息行为模型,深入剖析了用户信息行为特征以及影响用户信息行为的因素,并构建了科技文献信息用户画像的三层标签体系。之后阐述了科技文献信息用户画像构建过程中的关键技术,包括用户识别、会话识别、用户分群聚类、研究主题挖掘等。  最后,以国家科技图书文献中心网络服务平台的注册用户信息以及2017年用户访问日志为实验数据,利用K-MEANS聚类算法对用户聚类,总结每类用户的特征并选择合适的类名,然后基于科技文献信息用户画像的三层标签体系,选取每类用户中的一个用户,计算该用户各类标签的值或内容,构建其用户画像,利用文字和图形展示用户画像的结果。对用户画像结果的分析表明,本文构建的科技文献信息用户的三层标签体系能够较为全面地反映用户的全貌。
其他文献
[目的]本文以天山中部北麓为研究区,利用空间分辨率250m、16 d合成的植被指数产品(MODIS13QI),计算2000-2017年期间研究区年度、春季、夏季和秋季的植被覆盖度.[方法]通过运
储热技术是太阳能热发电和热电联产领域中的关键技术之一,其以储热材料为媒介,将太阳能光热、工业余热、低品位废热等热能储存起来,在需要的时候释放出来加以利用,以解决能量
[目的/意义]厘清图书馆智库职能构成,探索图书馆智库能力提升策略,为当前图书馆智库建设提供参考.[方法/过程]基于“信息-知识-智能”一体化理论,结合实践调研,界定图书馆智
档案工作在我国源远流长,但档案学作为一门独立学科诞生于20世纪30年代,初期有过短暂的发展,建国后进入新的发展时期,研究范围从业务经验总结上升到理论体系研究。改革开放之后至
本文从公民档案开放和公民档案利用权利的相关理论出发,结合国内外已有的相关研究成果,运用调问卷调查法和实地走访调查的方式,对公民档案利用行为及档案馆档案利用现状展开