论文部分内容阅读
Web2.0的迅速崛起,使各类虚拟在线社区服务如雨后春笋般涌现,诸如各种社交网站,BBS论坛等。由于Internet本身的特性决定了个人基于Web可以在短时间内建立大量“好友关系”,致使在线社会网络与实际社会网络相比更加庞大和复杂,因此在线社会网络的特性及其成员行为特点的研究倍受关注。同时由于在线社会网络成员身份具有隐蔽性,如何搜寻在线社会网络中潜在的组织成员也成为新的研究热点。本文以西祠论坛“南航天下”版块作为研究研究对象,通过大量真实的BBS数据挖掘成员关系网络,搜寻潜在的组织成员。主要工作包括以下几个方面:1.收集并制作“南航天下”版块的BBS数据集。该数据集包含了2005~2007三年的近9万条论坛主题内容。具体包含三类信息:①3万条BBS用户信息,如用户昵称,签名等;②近9万条主题信息,如主题名称,主题作者,主题内容,发布时间等;③70余万条回复信息,如回复作者,所回复的主题,回复的内容,回复时间等。丰富真实的数据为本文挖掘和分析BBS成员网络奠定了基础。2.基于BBS用户交互方式,构建相互回复关系网络和共同回复关系网络,并引入阈值(成员交互次数)作为判断成员之间是否存在关联的依据,分析和讨论了这两类复杂网络的特性,实验结果表明基于阈值的相互回复关联网络和共同回复关联网络都满足小世界特性和无尺度特性;分析用户行为特征,利用K-means聚类算法把BBS用户划分成5类,并用卡方检验验证不用类型的用户之间存在特定的交互模式。3.通过大量主题回复内容分析BBS用户回复特点,提取了约30个在主题回复中经常被使用,且能反映回复人对主题作者态度的关键词汇。邀请多位论坛用户对我们抽取的关键词汇进行评估,最后依据这些关键词汇构建BBS成员信任度关系网络,并讨论和分析信任度关系网络的特征。4.针对复杂在线社会网络成员身份的模糊性和不确定性,本文基于部分网络成员信息,使用信念传播算法推理或更新其他网络成员的信息,并使用扩展MPFS算法搜寻复杂在线社会网络中的潜在组织成员。