基于主题聚类的Web资源个性化推荐方法

来源 :湖北大学 | 被引量 : 0次 | 上传用户:yanzhijianer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Web技术的迅速发展,网络资源呈现爆炸式增长,资源的数量越来越庞大,资源总类日渐繁多。如此丰富的资源为人们的学习和生活带来了便利,人们可以通过网络方便的获取自己想要的各类资源信息。与此同时,如此海量的资源信息也给人们带来了不便,人们陷入了“资源丰富,信息缺乏”的窘境。如何从海量的网络资源中快速、准确的找到自己真正需要和有价值的信息成为人们迫切希望解决的问题。个性化推荐技术也因此受到人们广泛关注。基于主题聚类的Web资源个性化推荐技术既能利用聚类技术将同类的Web资源进行统一管理,又能依据用户的个体差异对用户进行合理的资源推荐,能够较好的满足人们快速获取信息的需求。本文首先系统的介绍了国内外Web资源个性化推荐和聚类技术的研究现状及相关算法,然后,着重介绍了基于主题的Web资源聚类方法(TWTC,Theme-based Web Text Clustering),传统的聚类方法或者没有考虑Web资源的主题信息,或者只考虑了单一主题的情况,而对于包含多个主题的Web资源还没有很好的聚类方法,基于主题的Web资源聚类方法正是基于此提出,该方法包括主题抽取、特征提取、特征表示及Web资源聚类几个步骤。其中,主题抽取是对Web资源预处理后产生的词集进行聚类,从而抽取Web资源的各个主题;特征提取是依据主题的权重,从各个主题中提取特征词以表征Web资源:特征表示是借助于VSM模型,用提取的特征词及相应权重表示Web资源;Web资源聚类是在特征表示的基础上,计算两个Web资源的相似度,并将相似度达到一定值的Web资源聚为一类。接着利用隐式跟踪方法对用户兴趣进行挖掘,通过在服务站点观察用户的浏览行为,计算用户对Web资源的兴趣度,并构建用户感兴趣的Web资源队列,然后利用TWTC聚类方法从用户感兴趣的Web资源队列中挖掘用户的兴趣信息。最后基于Web资源和用户兴趣的匹配度对用户进行Web资源的个性化推荐,本文考虑了用户兴趣可能随时间推移而发生偏移的情况,定期对获取的用户兴趣信息进行更新,并按照更新后的用户兴趣兴趣信息对用户进行动态Web资源推荐。实验部分选取另外三种方法与本文的方法进行了两组对比试验,并采用准确率和召回率对实验结果进行评价。试验结果表明,本文所提出的基于主题聚类的Web资源个性化推荐方法在准确率和召回率上比其他三类方法都有所提高,而且随着资源总数量的增加,本算法的稳定性也相对较好。本文创新点在于:首先,提出一种基于主题的Web资源聚类方法,该方法充分考虑Web资源的主题信息,在此基础上对Web资源聚类,提高聚类的准确率和召回率;然后,借助于此方法,对用户兴趣进行挖掘,从而提高用户兴趣模型的准确性,进而提高个性化推荐的准确率:同时考虑用户兴趣可能发生偏移,利用了时间窗格对用户兴趣进行更新,实现Web资源动态推荐。本文主要采用基于内容的方法对Web资源进行个性化推荐,但此方法目前只适用于Web文档资源的聚类,本课题以后将继续研究对Web音频和视频资源的聚类和推荐。
其他文献
PGPR自从被人们认识以来,学者们就对其对植物的促进作用机理十分感兴趣。如今,国内外工作者对于PGPR的作用机制已进行了诸多研究,现认为PGPR的促生机制包括固氮、溶磷、解钾、分泌激素以及生防作用等。由于影响根际微生物的生物多样性的重要因素之一就是植物的种类,同时根际微生物对于植物的种类也具有专一性,所以为了筛选出来更适宜玉米根际环境PGPR,从玉米根际土壤中筛选是十分必要的。本研究从玉米的根际土
当前,由于社会经济的快速增长,非再生能源的持续损耗,常规油气田储备资源不断地被开采出来,这导致易开采、能开采的资源不断地被消耗和使用,为保证供应需求量,世界各国逐渐将原油开采的目光转移到非常规油气藏,如砂岩致密储层、页岩地层等。水力压裂作为重要的储层改造和提高采收率的技术工艺,常用体系为胍胶水基压裂体系、油基压裂体系、粘弹性表面活性剂清洁体系等等。通过对各类体系进行研究,发现它们存在着各自的不足与
随着高铁时代和网络经济时代的到来,传统公路客运行业不断受到冲击,行业发展受到严重影响。传统的公路客运行业在面对铁路运输,尤其是高铁运输,以及网络时代的约车方式时,市
当前空间信息服务的实现机制,主要是依靠Web Service技术为基础,根据OGC组织制定空间信息服务规范,如WMS, WFS, WPS等。这些标准在实现空间信息资源共享与互操作方面起到了一
【目的】本研究旨在通过对比与分析眶上外侧与翼点两种手术入路治疗颅内前循环破裂动脉瘤的各种相关数据,为临床工作在术式选择方面提供参考。【方法】选取本院收治的73例颅内前循环破裂动脉瘤患者作为研究对象,根据手术方式的不同分为两组:A组(35例)采用经眶上外侧入路显微手术,B组(38例)采用经翼点入路显微手术。对比两组患者的性别、年龄、术前合并症、Hunt-Hess分级、改良Fisher分级、动脉瘤位置
信息时代的不断发展,使传统社区运维管理突显出很多弊端,随着智慧城市建设速度加快,社区运维管理方式转型势在必行。从社区运维管理现状入手,深入社区居民中展开调研,并对调
目前,在对比汉语习得的相关研究中,少有以斯瓦希里语与汉语的对比研究文献,而专门针对动词这种常用词类的研究就更少了。笔者在本文中尝试以汉语中的动词“打”和斯瓦希里语中的“piga”词语为分析实例,从语义、语法角度对这两种语言进行对比分析。对30名学生进行了访谈调查,针对斯瓦希里语学生“打”字词语教学和习得中的问题提出了参考性建议。进一步对受访者的回答进行分析探讨,以便增强本文研究的实践依据。笔者希望
分类与回归技术已经被广泛应用于人脸识别,卫星图像识别,信息安全等等多个领域。而集成学习能够有效地提升单个模型的分类与回归效果。然而前人的研究大多只关注集成学习器的
中空介孔材料因大的比表面积、低密度、化学性质稳定等优势,在能源储存、吸波、催化、气敏、药物传输等领域都有着广泛的应用。其中,中空介孔SiO2作为催化剂的载体,不仅可以避免活性物质团聚,而且减少了电荷载流子的传输距离、促使污染物分子富集,增强活性中心的催化活性。然而,这种复合材料的制备通常需要借助繁琐且耗时的硬模板法,而且催化剂难以磁分离。为了减少复合催化剂的制备流程,我们直接以介孔SiO2空心球为
随着三维互联网应用的迅速发展,虚拟环境中布料动画的需求越来越多。无论是在计算机3D游戏动画领域,还是在三维动画影视等领域,人们对于逼真性高、交互性强等动画效果的要求