StackExchange问答社区网络数据挖掘研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:andy630767963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
StackExchange是目前最流行的问答网站之一,其中包含了100多个问答社区,在知识传播过程中扮演了非常重要的角色。本文的目的是利用时下流行的复杂网络方法分析StackExchange问答社区中用户-问答-标签三者之间的复杂关联,并结合用户的地理信息,来更好地了解这些问答社区中知识的传播模式。本文在第一章首先介绍了若干当前流行的问答网站,回顾了目前该领域国内外的研究现状,并给出本文的研究内容;随后在第二章介绍了复杂网络的理论基础,包括复杂网络的结构特征,基于此建立的经典复杂网络模型:ER随机网络、WS小世界网络、以及BA无标度网络等,以及网络的信息传播模型;第三章介绍了StackExchange的数据集,介绍了任务驱动社会网络的概念,构建了用户-问题、问题-标签二分网络,并通过投影构建了用户问答关系网络和标签相似度网络,随后对这些网络进行了可视化并给出了它们的结构特征;进一步地,第四章对StackExchange中的四个问答社区的标签相似度网络随时间的演化进行了分析,发现不同类型问答社区的知识结构具有不同的演化规律。随后,为了研究StackExchange中问答社区在美国范围内的知识传播模式,在第五章,我们首先构建了美国州问答关系网络模型,虽然该模型能反映出美国的加州(CA)和纽约州(NY)在知识传播的过程中比较重要,但却不能很清晰地确定传播源的位置以及传播模式;鉴于此,我们构建了一种新的美国州知识传播网络模型,基于此模型,可以准确地找出问答社区中的传播源。我们发现大多数问答社区的传播源可能不止一个,随着时间的推移,问答社区中的知识会从多个传播源向其他州进行扩散。除此之外,我们还比较了美国州问答关系网络和知识传播网络的结构特征。在问答关系网络中,州与州之间的联系更紧密,连边密度较大,不同类型的问答社区结构模式有很大差异;而在知识传播网络中,州与州之间的连边密度较低,平均路径较长,从而使得传播脉络比较清晰,与此同时,我们还发现不同的问答社区具有相似的知识传播模式。这些对比实验说明了相较传统的问答关系网络模型而言,本文提出的知识传播网络模型能够更好地反映问答社区中的知识传播模式。第六章给出了本文的总结并对未来的研究工作做了展望。
其他文献
近年来,数据挖掘引起了信息产业界的极大关注。数据挖掘的目的就是从其应用领域中提取出大量的数据,通过数据挖掘技术将这些数据转换成对本领域有显著作用和深远意义的信息和
电力机车作为电气化铁道的运载者,是铁路运输的关键设备之一,电力机车在过分相区域运行时频繁变换各种状态,处于不同的暂态过程,将会产生高幅值的冲击电压或冲击电流,导致电
随着国家“节能减排”、“低碳经济”等发展战略的提出,清洁环保、节能高效的燃料电池成为新能源领域重要的研究热点之一,燃料电池逆变并网技术又是其推广应用的关键。本文以3k
超宽带技术作为一门新型的无线通信技术,最早出现于上世纪60年代,早期主要应用于军事领域。由于超宽带技术相比于传统无线通信技术而言,具有很多潜在的优势,因此美国联邦通信
从20世纪60年代开始,人们开始研究进化算法,试图发展一种具有适应任意环境的理论,使其用于通用程序和机器。到1975年遗传算法(genetic algorithm,GA)的创立标志着进化算法成
飞机燃油系统的测量精度和可靠性对飞机的使用安全有着重要的影响。我国飞机油量测量技术的研究开发比国外起步晚,燃油测量技术还比较陈旧。研究一种具有高灵敏度、抗干扰性
系统辨识是高性能自动化技术(如模型预测控制)中的重要内容。随着人们生活水平和工业生产水平的提高,人们对工业产品质量的要求越来越高,生产工艺对自动化技术的依赖程度也随
计算机视觉技术已在机械制造、安防监控、导航制导、机器人技术等领域得到了广泛的应用,是近年来发展最为迅速的学科之一。摄像机标定是计算机视觉系统建立二维图像和三维空
单相双级光伏并网逆变器以其光伏电压利用率好、结构高效且装机配置灵活等特点被广泛应用于分布式光伏发电系统。但传统的单相双级并网逆变器拓扑是通过Boost前级来控制直流母线电压恒定,输入电压实际上经历了先升压后降压的变换过程,会产生额外的开关损耗。因此,该拓扑结构的理论效率并未最大化。针对分布式发电系统高效性的需求,本文以单相双级并网逆变系统为研究对象,从结构优化和效率提升两方面改善双级并网逆变器的拓
学位
电力机车辅助变流器是为机车牵引及制动系统提供保障的一种重要设备,它的性能将直接影响机车的正常运行。由于这类变流器的单台容量较大,因此早期的辅助变流器往往存在体积大、