基于文本挖掘技术的微信公众号关系网络研究

来源 :东南大学 | 被引量 : 2次 | 上传用户:chen406507025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微信的不断发展,微信公众号已经成为了一大主流自媒体渠道,并形成了独有的自媒体生态圈。与传统媒体相比,自媒体具有更大的自由度。任何人群都可以通过微信公众号发表任何信息或者想法,信息量更加丰富。从而也带来了一些问题,一方面,微信公众号中充斥着大量的重复内容,如何获知微信公众号生态圈的发展状况成为了微信平台运营者关注的问题;另一方面,微信公众号信息传播过程较为隐秘,部分虚假信息在微信公众号之间进行传播,如何对微信公众号发布内容形成有效监管成为了相关监管部门急需解决的问题。本文是以网络爬虫技术、文本挖掘技术、在线社会网络分析为背景,以微信文章为研究对象。主要工作包括微信公众号数据的获取和处理,微信公众号内容相似关系网络的构建和分析以及基于特定主题的微信文章传播网络的构建和分析。本文讨论了获取微信文章的方法,并提出了微信文章网络爬虫的设计方案。本文结合微信文章的特点,设计实现了多种文本相似性度量方法,采用真实的微信公众号文章构建实验数据集,比较了不同的方法在实验数据集上的表现和特点。并在实验结果的基础上,提出了融合文本字符和文本语义两方面信息的文本相似性度量方法,为微信公众号内容相似关系网络的构建和微信公众号基于特定主题的内容传播路径构建提供了基础。在微信公众号生态圈发展现状的研究中,本文提出了构建微信公众号基于内容相似关系网络的方法。通过在线社会网络分析的方法,剖析了目前微信公众号生态圈的发展状况。结合微信文章阅读量参数,分析了微信公众号内容相似关系网络中的节点加权度与阅读量之间的相关关系。在微信公众号信息传播的研究中,本文提出了构建微信文章传播路径的方法。并提出了在微信文章传播过程中存在强传播网络和弱传播网络的概念,它们能够有效地构建出“转发”和改写重发布形成的内容传播路径。结合信息传播实证研究的相关理论,对传播过程中不同节点的影响力进行了分析。本文提供了一套研究微信公众号平台的框架,有利于了解微信公众号生态圈的发展状态和微信公众号之间的信息传播现状,对微信运营和网络舆情监测具有较高的参考价值。
其他文献
高中数学新课标人教B版教材选修2-1中,最小角定理仅作为直线与平面成角定义的补充进行了阐述。深入延伸教材中关于最小角的相关内容,引导学生结合实际背景理解最小角概念,运
目的:以儿童生长发育及儿童健康管理为理论基础,了解不同性别、不同年龄组儿童的生长发育状况与血液微量元素浓度情况,分析不同生长发育状态下血液微量元素浓度差异性及血液
新闻集团和道琼斯公司8月28日宣布,美国反垄断监管机构联邦贸易委员会已经批准新闻集团以50亿美元并购道琼斯公司。引起全球瞩目的传媒业的大并购再次证明,全球传媒业的格局
本文分析了简历的主要格式和所涉及的内容,同时针对高校毕业生的特点,探讨了如何更好的有针对性的书写简历。
质监技术机构是质监事业发展的技术支撑,是质监事业实现可持续发展的根本保障。但在竞争激烈的新形势下,技术机构的发展正面临着诸多困难,尤其是县级技术机构的现状不适应当前质
沙镇溪镇台子湾村是湖北省秭归县四个“农村产权制度改革的试点”之一,经过精心准备、广泛宣传,辛苦工作,历时4个月,核查台子湾村共有742户,2411人,其中集体经济组织成员732
简单介绍了模糊数学综合评判方法。将该法应用于衬衫复合材料服用性能的评价,以此可以判断衬衫复合材料的适用性。
指出了村镇生活垃圾处理问题并提出了相应解决方案,综述了互联网+在村镇垃圾处理中的主要技术,并研究构建了"互联网+"垃圾处理技术在村镇垃圾处理中应用,分析了存在的问题,给
本文运用现代计算机、自动化和通讯控制先进的软、硬件技术,对水利枢纽工程安全监测对象进行分析,并进行一套功能齐全、稳定可靠、使用方便的安全监测自动化系统的设计,达到
目的探究个体化护理对肺癌放疗患者的治疗效果及生活质量的影响。方法本次试验对象为我院自2014年1月~2016年1月以来所收治的75例肺癌放疗患者,按照编号单双数方法将患者分为