社会网络中的微博用户推荐算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lewy540
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博平台中用户的爆炸式增长,其用户创造的信息也随之呈指数级增长。从而导致过量的数据使得用户无法有效地获取自己想要的信息,即信息的使用率反而降低,信息过载的问题则日益加剧。目前的搜索引擎等技术只能满足人们部分的需求,没有个性化的考虑,仍无法有效地解决这个问题。用户推荐作为一种信息过滤手段,是解决这个问题非常有潜力的方法。因而如何发展高效的,可扩展的,非常精确的用户推荐算法是一个巨大的挑战。本文根据目前流行的微博平台的特性提出了两种用户推荐算法,一种是基于领域偏好度的名人推荐算法,另一种是基于社区信息传播力的用户推荐算法。基于领域偏好度的名人推荐算法将用户推荐问题转化为一个基于链接预测的分类问题,它基于名人用户所属的领域来围绕目标用户和被推荐名人用户提取一系列的特征并以此构建一个n维的特征向量,再利用分类器过滤有限的名人集合而得到该用户的名人推荐集合。基于社区信息传播力的用户推荐算法则是基于社区划分的思想,即将兴趣相似的用户聚到一个社区,通过分析该社区的消息流动情况,来挖掘社区中对消息传播具有控制能力的消息中间人,同时结合目标用户自身的特点从消息中间人中选取合适的用户推荐给他。另一方面,为了解决当前海量数据处理的问题,本文针对两种推荐算法还提出基于Map-Reduce的并行化实现方法。通过在微博平台数据集上的实现与测试,验证了两种推荐算法的可行性及有效性。根据推荐算法的一般评估方法,本文提出的两种推荐算法与其它常用的推荐算法相比,效果均有所提高。同时基于Map-Reduce的并行化实现,算法性能明显高于其单机环境。
其他文献
智能视频监控是机器视觉领域中的一个重要分支,是未来安全监控技术的发展趋势,在机场、银行、商场等场所中有着广泛的应用。其中运动目标检测技术是实现智能视频监控的关键技术
随着信息社会的不断发展,海量数据的作用日益明显。多重检验作为分析高维数据的重要理论,已经引起了许多统计学者的注意。多重检验有着广泛的应用,比如生物信息学、医药行业以及
粗糙集理论(Rough Set Theory, RST)作为一种能够有效分析和处理不精确、不确定和不协调信息的数学理论是波兰数学家Pawlak教授于1982年提出来的。在Pawlak经典粗糙集的研究
教务管理系统是高校教学管理的核心,一个科学的教务管理系统对于提高高校的管理水平、效率、质量以及保障正常的教学秩序起着决定性作用。教务管理系统的设计既要科学,具有完善
基于小波变换的图像压缩方法是一直以来都是图像处理领域比较重要的一个研究方向,而基于提升结构的小波变换能够方便的实现从整数到整数的变换。自适应方向提升(AdaptiveDirec
随着Web服务的普及,服务数量的增多,用户在使用服务时会遇到三个问题:首先,近年来,服务数量呈现出一个剧烈增长的趋势,在实际中存在许多功能相同或相似的服务,这导致用户需要进行多
近年来,随着信息技术和电子技术的快速发展和不断成熟,嵌入式设备已经延伸到了人们日常生活的各个领域。嵌入式设备应用的类型和应用范围的不断扩大也使得嵌入式设备的市场竞争
随着计算机软件产业的发展,软件的规模日益增大,软件的质量也受到人们越来越多的关注,往往一个细微的漏洞都有可能被恶意攻击者利用,给用户造成难以估计的损失。因此运用测试技术
随着互联网的飞速发展,人们正面临着包括图像在内的各种多媒体数据的爆炸式增长。如何快速,有效地从海量的图像数据中检索出所需要的图像是目前一个急需解决的重要问题。然而底
随着信息技术的迅速发展,很多领域都出现了容量庞大的数据管理系统,为帮助用户从这些含有噪声的海量数据中分析出有价值的知识,数据挖掘(DataMining,DM)技术应运而生。聚类(C