基于复杂网络分析的微博社区发现

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:zwj1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一种新兴的社交平台,在社交网络中占据了十分重要的地位。由于微博有信息传播迅速、实时性强、交流方便等特点,因此它吸引了大量来自不同行业、领域的用户。正是由于微博用户职业的多种多样,兴趣的多种多样等,导致了在微博网络中存在许多不同种类的社区。微博社区发现的主要目的是通过采用某种方法,对微博用户网络进行组织与划分,以使相互之间有最大相似度的微博用户聚集在一起,从而形成一个个的微博社区。显然,可将数据挖掘技术应用于微博网络,以达到发现微博网络中的社区结构的目的。该研究领域业已存在相当数量的社区模型和社区发现算法,并取得了一定的研究成果。随着互联网技术的发展和社交工具的日益推广应用,人们的社交方式也在逐渐改变,对社区发现研究提出了新的挑战。基于以上背景,本文在分析已有微博社区发现技术的基础上,针对传统算法大多仅考虑单一因素,难于有效识别微博中多个社区的问题,借鉴社会网络分析思想,综合考虑微博用户的主题相似度和链接关系,基于标签传播算法展开微博社区发现的研究,主要研究内容为:(1)以新浪微博为例,分析研究了微博的类型、结构特征与功能,分析了微博社区的无标度性、链接关系与同质性。(2)研究了社区发现的经典技术与文本分析的基本方法,并进行了对比分析。(3)针对微博这一被广泛使用的社交媒体,在将其抽象成为一个网络之后,以标签传播算法为基础,通过分析网络中节点的主题相似度及不同节点之间的标签传播概率,提出了一种从复杂网络分析角度出发进行研究的微博社区发现算法,并针对新浪微博数据集,与GN算法和Spectral Bisection Method进行了初步的对比实验,实验证明了本方法的有效性。
其他文献
随着数字图像和视频的广泛应用,数字图像质量评价的重要性日益增长。图像质量评价是图像处理领域的一个基础性的问题,它既有其重要的理论意义,同样也有广泛的应用背景。通常
在当今社会的通信行业内,各个电信企业的竞争随着移动用户数量的增加越来越激烈,如何争取到这些客户并维持原有老客户成为每个电信企业亟待解决的问题。这就为电信企业建立经营
随着Internet的迅速发展和GIS应用技术的不断成熟以及对地理信息共享和互操作需求的日益迫切,WebGIS已经成为当前GIS应用领域的一个研究热点。WebGIS解决了传统桌面GIS应用的
进入新世纪以来,网络技术的发展日益迅速,并且随着制造业的发展,工厂对无线电子类产品的制作工艺不断改进,因此制造成本也在不断降低,与此同时,无线网络技术得到了更加广泛的
随着计算机和通信技术的发展,企业信息安全问题受到越来越多的关注。企业除了要抵御来自外界攻击和破坏,同时还要防止来自内部的有意或无意的泄密。仅依靠完善管理制度很难从
框架技术和设计模式是J2EE中重要的软件复用技术,通过使用框架技术提高了软件的开发效率,几乎所有的框架技术都会使用一种或多种设计模式。如何选择框架并建立适合企业应用的
随着计算机应用领域的迅速扩大,软件规模及复杂性的不断提高,软件危机日益严重,提高软件的生产效率和质量成为软件产业的当务之急。近些年来面向对象技术的发展成熟和Interne
本体自哲学中提出,至知识工程中引入,并越来越多的应用于计算机支持的各类计算和应用的结构之中。同样在网络中,下一代语义网的基础也是在本体论指导下的自然语言理解、语义
通过视频监控和穿戴设备实现的传统老人监控系统,容易给老人造成心理压力和身体上的不适。而且传统监控系统扩展性差,不宜推广使用。对于自助老人的监控,需要一种成本低、易
无线射频识别(简称RFID)技术是从上世纪六七十年代兴起的一项非接触式自动识别技术。现已进入实用化的节段,并广泛的应用于工业生产和日常生活的各个方面。该技术的应用提高