标签系统中基于语义社团的个性化信息推荐研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:a568420740
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0环境下,互联网已成为全球最大的信息资源库,大量的信息在给人们带来诸多便利的同时,也不可避免地导致了“信息泛滥”、“信息迷航”等问题。个性化信息推荐可以根据Web用户的信息需求主动向Web用户提供合适的信息,成为解决这些问题的重要手段之一。在标签系统中,“用户—资源—标签”之间的关系网络为个性化信息推荐提供了十分有价值的基础数据,但已有的相关研究主要从关系网络的结构特征来分析用户之间的关系,忽视了标签系统中丰富的语义信息,制约了基于社会网络的个性化信息推送模型的质量。因此,本文通过构建标签的概念空间发掘标签之间的语义关系,进而将概念空间与社团发现相结合,提出融合概念空间模型的语义社团发现方法,最后根据语义社团结构特征构建个性化信息推荐模型。本文的研究主要包括三个方面的内容:第一,构建基于标签的概念空间。标签可被视为由用户主动生成的一种元数据,标签体现了用户的认知结构特征,包含了丰富的语义信息。利用标签对用户进行聚类后,同属一个类别的各个用户的兴趣结构存在相似的可能性,彼此之间产生信息互动关系的概率也会相对较大。由此,本文首先通过标签聚类形成标签主题,然后通过构建空间向量、关联矩阵、相似性矩阵等操作构建基于标签的概念空间模型,实现标签主题语义层次分析,为后续利用标签对用户进行聚类奠定基础。第二,提出融合标签概念空间的语义社团发现算法。基于标签的用户聚类将具有相似认知结构的Web用户聚集在一起,在标签系统中可以通过这种聚类来构建隐性的社会网络。本文针对每个标签主题内部的隐性社会网络,提出融合标签概念空间的语义社团发现算法,将网络内部节点的标签语义(概念空间模型)引入到社团发现过程中,使得社团内部用户语义相似度尽可能大,社团外部用户语义相似度尽可能小。在具体实现过程中,首先根据隐性社会网络内部用户使用标签的频次、用户使用标签对应的TF-IDF值来计算用户之间的相似度,并根据相似度的大小来衡量用户之间的亲疏程度,从而形成用户之间的关系网络。然后借鉴SemTagP算法的思想,在社团发现过程中充分考虑社团内部节点的语义信息,将概念空间模型与社团发现有机融合,实现语义社团的划分。第三,基于语义社团实现个性化信息推荐。语义社团的划分是基于每个标签主题所对应的隐性社会网络,因此,本文的个性化信息推荐仅针对每个隐性社会网络内部形成的社团结构。由社团结构的基本特征可以得出:同属一个社团的Web用户的兴趣具有较大的相似性,而不同社团的WWeb用户的兴趣具有较大的差异性。因此,社团内的个性化信息推荐可以借鉴协同过滤思想来实现,社团间的个性化信息推荐则考虑分属不同社团的两个节点之间可能存在强联系的情形,利用扮演“信息桥”角色的节点实现社团间的个性化信息推荐。
其他文献
这项研究的目的是通过在巴基斯坦的社会投资,调查贫困的公共部门以及有条件的现金转移对青年教育的影响。有条件的现金转移是—项创新计划,是社会保护行动的一个组成部分,目
《淮南子》的哲学思想体系独树一帜,有其独到之处,其中所蕴含的生态智慧,更具有重要的研究价值。它以“道”为始基,构建了一个较为完整的宇宙观模型。《淮南子》尊天地为父母,视万物为兄弟,形成了天地万物为一体的大家庭的概念。在生态价值取向层面,一方面,《淮南子》认为“贵贱”只是人从“以己观物”的狭隘视野产生的概念,在“以道观物”的视野中,万物都有各自存在的价值。另一方面,《淮南子》承认万物生命的复杂性和特
ELMOD2是ELMO蛋白家族成员之一,人类ELMO蛋白家族现有六个成员,包括 ELMOD1,ELMOD2,ELMOD3,ELMO1,ELM02 和 ELM03。通过同源性比较归为两个亚类:ELMODs和ELMOs亚家族。ELMOD1
为提高我国基础研究水平,改变国家基础科研的资助方式,国务院于1986年2月14日批准成立国家自然科学基金委员会。许多学科在近几年对国家自然科学基金资助情况都做了统计以及
由于骨损伤疾病越来越多,有关人体植入材料的研究越来越重要。碳纤维(CF)增强的聚醚醚酮(PEEK)具有接近人骨的机械强度和模量,可被用于人工植入领域。但是PEEK的生物惰性会影响植入体的骨整合和周围组织生长,为了提高CF/PEEK复合材料的生物活性,需对其表面改性处理。然而,改性后的CF/PEEK作为植入材料,仍存在细菌感染等风险,在临床上会引发严重的并发症,危及患者生命。另外,如果植入材料的耐磨
提升小麦产量、改良小麦品质、增强小麦抗病虫及抗逆性,是小麦育种永恒的主题。遗传理论研究育种实践表明,我国小麦育种业已进入瓶颈期,特别是小麦产量育种,产量水平长期徘徊
背景:内镜下粘膜剥离术(endoscopic submucosal dissection,ESD)是一种微创治疗消化道肿瘤的方法,已经成为治疗消化道早期肿瘤及癌前病变的首选治疗方式。ESD术的并发症较高,
体育博彩活动,特别是青年体育博彩活动在卢旺达迅速蔓延开来。这项研究的具体目标是评估生活在卢旺达基加利市中的青年参与体育博彩的动机,研究分析社会经济和心理对这种形式
脑机接口是一种不需要通过人的神经肌肉,仅利用其脑电信号就可以直接地控制电脑或其他机器运作,从而实现人脑与外部设备信息交互的新技术。针对现有脑机接口技术存在编码效率及指令识别准确率低的问题,本文从脑控字符拼写系统诱发范式和指令信息解码两方面展开研究,并通过实验验证了所提出的视听混合刺激诱发脑机接口的有效性。首先,为了研究视、听觉刺激及其语义匹配性对脑机接口性能的影响,共设计了四种刺激方式的数字拼写实
近年来,国内汽车行业发展迅速,但也面临着众多挑战。为应对这些挑战以及提高汽车企业自身的竞争力,越来越多的汽车企业积极寻求战略合作伙伴,成立汽车企业联盟,通过合作提升