社会化标注中用户标签的主题鲜明性研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:A136C316
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社会化标注中,允许用户自由地使用标签对信息资源进行标注,极大地激发了大众参与的积极性与主动性。这种开放、灵活、有趣的信息分类组织方式反映了用户的主观思想,应当挖掘社会化标注的使用模式与规律以及努力探索它的最佳使用。现有研究着重于把标签作为单独的个体角度研究标签的使用模式和规律,较少关注于标签主题角度。但用户使用的标签久而久之形成了不同的标注主题,揭示用户的差异性,这对于基于用户的兴趣偏好提供个性化服务而言具有重要意义。因此有必要从标签主题角度出发探讨社会化标注的模式与规律。为此,结合国家自然科学基金项目“泛在计算环境中社会化驱动的情境感知个性化信息服务研究”(项目编号:71471165)开展用户标签的主题鲜明性研究。本文的主要工作和贡献如下:(1)社会化标签主题建模。将社会化标注中用户持久的标注行为产生的用户标签集与文档主题模型中文档词汇类比,结合LDA理论基础构建社会化标签主题模型,获取用户标签主题概率分布。(2)用户活跃度刻画与用户社区发现。根据超网络中超度的概念定义了用户的活跃度,刻画用户标注的活跃程度;同时依据复杂网络的理论知识,分别以用户朋友关系和标注关系构建了以用户为节点的复杂网络,并使用了Wakita-Tsurumi社区发现算法进行网络划分,获取用户社区。(3)度量指标的构建。借鉴信息论中信息熵的概念,构建了度量用户标签主题鲜明性的量化指标,包括用户主题熵、用户平均主题熵及用户社区主题熵。(4)实证分析。选取来自Last.fm和MovieLens社会化标注平台的用户数据,从单用户、用户活跃度以及用户社区3个角度出发,对用户标签的主题鲜明性展开实证分析。实证结果表明:(1)主题极鲜明的用户较少,大部分用户主题较模糊;(2)随着用户标注资源数量的增加,标签主题的鲜明性越强;(3)用户社区中成员用户对少数主题的认识程度较相似,对大部分主题的认识各不相同。研究发现揭示了用户标注的标签主题模式和规律,有益于社会化标注在网络资源的组织和发现。
其他文献
人生无常的悲哀是古今中外文学创作的一大“母题”,而晏殊的《浣溪沙》于这共通的情感之中却另有一番“富贵闲人”的风格,这既是源于词人的主观心境,也和自身经历密切相关.对
提奥多·冯·舍恩是普鲁士著名政治家、改革家,在19世纪上半叶的普鲁士改革中发挥了极为重要的作用.对普鲁士历史影响深远的《十月敕令》即是由他主笔起草.舍恩思想鲜明、位
杜勃罗留波夫与别林斯基和车尔尼雪夫斯基齐名,并称为俄国最伟大的文艺理论家,其在文艺理论批评上不仅继承了前人优秀的学术传统,还秉承了唯物主义哲学思想,同时对俄国文艺理
信息技术服务业作为我国的战略性新兴产业,它的发展不但关系到信息产业整体竞争力的提升,还对产业结构的调整以及经济发展方式的转变具有非常重大意义。随着全球化进程的加快和
“鱼龙戏”(即鱼龙曼延)作为一种大型幻术,入唐以来,深受朝廷及百官的喜爱,在宫廷宴饮中频频上演,其表演的时机除去元日、上元、人日、寒食节、上巳节等传统节日外,还与皇帝