论文部分内容阅读
随着微信的不断发展,微信公众号已经成为了一大主流自媒体渠道,并形成了独有的自媒体生态圈。与传统媒体相比,自媒体具有更大的自由度。任何人群都可以通过微信公众号发表任何信息或者想法,信息量更加丰富。从而也带来了一些问题,一方面,微信公众号中充斥着大量的重复内容,如何获知微信公众号生态圈的发展状况成为了微信平台运营者关注的问题;另一方面,微信公众号信息传播过程较为隐秘,部分虚假信息在微信公众号之间进行传播,如何对微信公众号发布内容形成有效监管成为了相关监管部门急需解决的问题。本文是以网络爬虫技术、文本挖掘技术、在线社会网络分析为背景,以微信文章为研究对象。主要工作包括微信公众号数据的获取和处理,微信公众号内容相似关系网络的构建和分析以及基于特定主题的微信文章传播网络的构建和分析。本文讨论了获取微信文章的方法,并提出了微信文章网络爬虫的设计方案。本文结合微信文章的特点,设计实现了多种文本相似性度量方法,采用真实的微信公众号文章构建实验数据集,比较了不同的方法在实验数据集上的表现和特点。并在实验结果的基础上,提出了融合文本字符和文本语义两方面信息的文本相似性度量方法,为微信公众号内容相似关系网络的构建和微信公众号基于特定主题的内容传播路径构建提供了基础。在微信公众号生态圈发展现状的研究中,本文提出了构建微信公众号基于内容相似关系网络的方法。通过在线社会网络分析的方法,剖析了目前微信公众号生态圈的发展状况。结合微信文章阅读量参数,分析了微信公众号内容相似关系网络中的节点加权度与阅读量之间的相关关系。在微信公众号信息传播的研究中,本文提出了构建微信文章传播路径的方法。并提出了在微信文章传播过程中存在强传播网络和弱传播网络的概念,它们能够有效地构建出“转发”和改写重发布形成的内容传播路径。结合信息传播实证研究的相关理论,对传播过程中不同节点的影响力进行了分析。本文提供了一套研究微信公众号平台的框架,有利于了解微信公众号生态圈的发展状态和微信公众号之间的信息传播现状,对微信运营和网络舆情监测具有较高的参考价值。