论文部分内容阅读
StackExchange是目前最流行的问答网站之一,其中包含了100多个问答社区,在知识传播过程中扮演了非常重要的角色。本文的目的是利用时下流行的复杂网络方法分析StackExchange问答社区中用户-问答-标签三者之间的复杂关联,并结合用户的地理信息,来更好地了解这些问答社区中知识的传播模式。本文在第一章首先介绍了若干当前流行的问答网站,回顾了目前该领域国内外的研究现状,并给出本文的研究内容;随后在第二章介绍了复杂网络的理论基础,包括复杂网络的结构特征,基于此建立的经典复杂网络模型:ER随机网络、WS小世界网络、以及BA无标度网络等,以及网络的信息传播模型;第三章介绍了StackExchange的数据集,介绍了任务驱动社会网络的概念,构建了用户-问题、问题-标签二分网络,并通过投影构建了用户问答关系网络和标签相似度网络,随后对这些网络进行了可视化并给出了它们的结构特征;进一步地,第四章对StackExchange中的四个问答社区的标签相似度网络随时间的演化进行了分析,发现不同类型问答社区的知识结构具有不同的演化规律。随后,为了研究StackExchange中问答社区在美国范围内的知识传播模式,在第五章,我们首先构建了美国州问答关系网络模型,虽然该模型能反映出美国的加州(CA)和纽约州(NY)在知识传播的过程中比较重要,但却不能很清晰地确定传播源的位置以及传播模式;鉴于此,我们构建了一种新的美国州知识传播网络模型,基于此模型,可以准确地找出问答社区中的传播源。我们发现大多数问答社区的传播源可能不止一个,随着时间的推移,问答社区中的知识会从多个传播源向其他州进行扩散。除此之外,我们还比较了美国州问答关系网络和知识传播网络的结构特征。在问答关系网络中,州与州之间的联系更紧密,连边密度较大,不同类型的问答社区结构模式有很大差异;而在知识传播网络中,州与州之间的连边密度较低,平均路径较长,从而使得传播脉络比较清晰,与此同时,我们还发现不同的问答社区具有相似的知识传播模式。这些对比实验说明了相较传统的问答关系网络模型而言,本文提出的知识传播网络模型能够更好地反映问答社区中的知识传播模式。第六章给出了本文的总结并对未来的研究工作做了展望。