基于斥力张力模型的博客社区发现及可视化

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:li875
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Blog是一种基于RSS技术的信息交互平台,它是一种作者与读者以日志风格进行交互的中介。与传统的网络信息相比,Blog领域链接关系更加丰富,Blog作者间交互更加频繁,Blog为用户在互联网上发布信息和进行交互提供了方便。  随着Blog及其相关领域的迅速发展,信息数量的增长和信息源的增加给互联网用户查找自己所关心的信息带来了不便。另一方面,Blog作者通过阅读或评论等行为与其感兴趣的Blog日志撰写者进行交流,从而围绕兴趣爱好形成很多潜在的社区,如何发现这些社区并分析社区成员之间的关系已成为一个亟待解决的社会学问题。本文对 Blog社区发现和可视化进行了深入分析,主要研究工作包括:  (1)采用基于双向意识和基于内容的Blog关系计算的关系提取算法,此算法综合考虑了Blog双向意识关系和post相似度关系,通过Blog空间中的双向意识操作提取出博主之间的双向意识关系,通过比较两个blogger的post得到基于内容的关系。  (2)提出一种基于斥力张力模型的关系强化算法,针对Blog之间的特点,设计了Blog之间的斥力张力模型。实验表明,该算法可以有效的改善社区发现的效果。  (3)提出了基于核心节点的社区流向图布局算法。实验表明,该算法可以很好的展示社区的核心节点,以及核心节点和其他节点之间流量的关系,向用户展示了更清晰的网络结构。  基于以上的研究成果,本文设计并实现了一个Blog社区发现和可视化的实验原型系统,包括了数据解析、关系提取、关系强化、社区发现和可视化等模块,为进行相关的算法实验和研究提供了一个平台。
其他文献
网络化通信是PLC(Programmable Logic Controller)的发展方向,而主从通信是PLC的基本通信方式,大量地应用在工业现场设备等控制系统中。主设备通过读取或写入从设备内存量,达
频繁模式挖掘是数据挖掘中的一项重要工作,也是关联规则挖掘的一个关键步骤,可以应用于诸如分类、聚类、预测等数据挖掘任务中。目前,关联规则挖掘结果多以在线交互方式导出,
作为世界上人口最多的国家,加强计划生育和人口管理现代化,对于我国各项事业的发展至关重要。利用先进的计算机网络技术,建立联网的育龄妇女服务与管理信息系统,实现育龄妇女
近年来,无线传感器网络伴随着微电子技术、无线通信技术和网络技术的发展而产生,其无需基础设施、具有自组性、随机部署和多跳的特性使其应用越来越广泛,涉及到军事、商业、环境
随着网络经济的兴起,电子商务得到了快速的发展与应用。因而也促进了社会对电子商务方面人才需求量及其素质要求的提高。这就对电子商务人才的产地之一:学校,提出了更高的要
伴随着互联网的快速发展与普及,越来越多的个人用户在使用网络应用的同时产生大量的数据。而云技术的发展也使得更多的企业用户选择将数据服务迁移到云中。在电子商务、社交
当下,海量视频数据中包含着丰富的信息,对于这些视频进行分析处理的需求也越来越多。有的视频其视频质量非常低,其中字符大小极小,而且受到噪声的干扰,本文中称为“超低质量
半径-间隔学习方法作为机器学习领域较为热门的研究方向之一,在分类和识别等应用中得到了广泛的关注。半径信息的变化隐含在特征变换过程中,对于分类器的性能优化起着重要的
RFID技术是一种非接触的自动识别技术,操作方便、快捷,阅读器可以在一定范围内任意方向读取一个标签或多个标签,其优势是交易速率快,但由于安全性不高,在实际应用场景中受到
随着通信和无线接入技术的快速发展,能够为移动的主机提供网络的服务成为一种需要。移动IP协议是通信终端在移动中保证通信连接性的协议,通过该协议可以使终端在移动时仍然保