论文部分内容阅读
随着互联网技术的发展和各种社交网络平台的不断涌现,使得人们参与话题讨论并表达自我观点越来越方便。近年来,网络言论所形成的网络舆情已逐渐成为社会舆情的重要组成部分。话题发现和情感倾向性分析是网络舆情分析的两个重要方面,对网络舆情分析有巨大的作用。从网络舆情数据中发现话题并分析其情感倾向性,是了解大众对社会话题的看法的一种有效途径。教育作为大众所关注一个重要方面,教育领域网络舆情对社会有着巨大的影响,因此如何对教育领域网络舆情进行有效监控与分析已成为亟需解决的问题。本文在教育领域的背景下,主要研究网络舆情监控与分析系统中的关键问题的解决方法,并基于该解决方法对网络舆情监控与分析系统进行了详细设计与实现。首先,本文对网络舆情监控与分析系统中的关键问题进行了详细的方法设计,具体包括舆情数据获取和舆情数据分析。在舆情数据获取中,分析了新闻论坛类站点和微博类站点的页面特征和舆情数据特点,并利用网络爬虫技术设计了一个具有良好扩展性和维护性的网络爬虫;舆情数据分析包含话题发现和话题情感倾向性分析两个问题,本文学习了LDA主题模型并做改进,提出了基于增量Gibbs采样的LDA模型,并基于该算法实现了话题发现,同时,还研究了基于情感词的话题情感倾向性分析方法。然后,本文对网络舆情监控与分析系统进行了详细设计与实现。在详细设计之前,对系统需求进行了详细阐述并对系统的总体架构和功能结构进行了设计;根据系统的总体设计和舆情数据获取与分析的方法研究,设计实现了网络舆情监控与分析系统。该系统可实时监控用户指定的网络舆情数据源,从中发现话题并分析其情感倾向性,并将监控与分析结果通过可视化的方法呈现,使用户能够快速、全面地了解舆情动态。最后,本文对网络舆情监控与分析系统进行了全面的测试,包括系统功能测试、系统性能测试和关键方法实验结果分析。功能测试保证功能的可用性和完整性,测试结果表明网络舆情监控与分析系统的功能达到需求并可以良好运行;系统性能测试保证系统的负载能力,测试结果表明网络舆情监控与分析系统的负载能力较强;在系统功能良好且负载能力较强的情况下,为了验证系统分析结果的有效性,本文对系统中话题发现和情感倾向分析进行了实验分析,分析结果表明,基于LDA的话题发现和基于情感词的情感倾向性分析的结果是有效的,能够给用户提供有效有价值的分析数据。