校园舆情分析中的意见挖掘技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:mfktadxxxa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为互联网的重要组成部分,校园BBS完善了信息化校园的新型校园形态,成为了师生在日常生活中自由获取信息和交流意见的平台。但是随着意见的扩散和逐步深入,各种观点发生交流、碰撞、融合,最初个人的意见可能转化为大多数人的集体意识,最终形成一定规模的校园网络舆情。因此,构建针对校园BBS的舆情分析系统,对校园舆情进行深入的意见挖掘是重要并且必要的,本文将从以下两个方面研究校园舆情分析中的意见挖掘技术:在文本倾向性分析方面,本文结合校园BBS中用户常用的情感表达方式,提出了基于情感表达特征的文本倾向性分析模型。本文从文本预处理模块、文本特征选择模块和基于SVM的情感倾向性分析模块介绍了文本倾向性分析流程。在文本预处理模块,本文研究了现有情感词汇资源,总结并整理了用户词典、停用词词典、否定词词典和情感词词典。基于辅助词典,一方面提高了分词的准确率,使分词结果更易于进行情感分析,另一方面也降低了某些高频词汇的噪音影响,进一步细化了文本预处理的结果。在文本特征抽取模块,本文分析了用户常用的情感表达方式,同时结合了校园BBS帖子具有长度较短并且存在大量变形词的特点,从Bi-gram和情感短语特征、标点符号特征、表情符号特征深度挖掘了文本所蕴含的情感色彩。在意见领袖识别方面,本文提出了基于用户特征与交互网络的意见领袖识别算法HITS_FEATURE,该方法结合用户的特征权重值,分析用户交互网络结构,最终识别校园BBS中的意见领袖。首先,通过引入运筹学中的层次分析法,分析用户特征中的威望度、活跃度、影响力,定量计算用户的特征权重值。然后,根据用户转发、评论帖子的行为,构建用户交互网络,分析用户交互中的情感倾向性。最后,基于本文提出的HITS_FEATURE算法,计算用户的权威值,筛选出校园BBS的意见领袖。最后,利用从校园BBS爬取的实验数据,本文以校园舆情分析中的意见挖掘技术为研究核心,针对其中文本倾向性分析和意见领袖识别两个部分,设计并详细分析了实验。实验结果表明,本文提出的基于情感表达特征的文本倾向性分析和基于用户特征与交互网络的意见领袖识别模型是可行的,能有效提高校园舆情分析中意见挖掘的准确度。
其他文献
目前很多学校建设了校园网络,在硬件方面做到互连互通不成问题,但在构建适合学校特点的网络化的课程资源与教学管理软件方面,仍处于滞后状态。很多学校的校园网络的功能主要是提
3G时代的到来,使以手机为主的移动设备上网速度得到一个大幅度的提升。无线城市的建设、手机用户数量的与日俱增、智能手机的普及、经济危机下国家发展电子商务的政策导向,以及
近年来,光层组播和网络编码逐步成为热点研究领域。随着网络技术的发展,WDM(Wavelength Division Multiplexing)已经成为了一种主流传输技术;与此同时,日益增加的多播业务给网络
学位
公路是国民经济赖以发展的重要基础设施,在国家整个综合交通体系中有着广阔的发展前途,对发展社会主义商品生产,繁荣城乡经济,巩固国防,密切国际交往,方便人民生活都具有十分重要的
随着网络通信技术的飞速发展,ASN.1(Abstract Syntax Notation One)语言在各个领域有着广泛的应用。它是一种用来描述结构化信息的标记语言,适合用来描述复杂的协议,是目前电信
学位
光纤通信的诞生成为通信史上的一次重要革命,它极大地改善了传输带宽,光网络技术的迅速发展为Internet日益膨胀的信息流量提供了强大的网络支持。波分复用(WDM)光网络有效地
学位
人脸识别技术是目前生物特征识别中最受人们关注的一个分支,是计算机视觉与模式识别领域非常活跃的一个研究方向。人脸图像的特征提取是人脸识别技术非常重要的组成部分,对于识
学位
道路提取是遥感图像分析、理解和目标提取中的重要问题之一,它在遥感测绘、地理信息系统(GIS)、军事应用等领域都具有重要的价值和意义。遥感图像中信息的复杂性和多样性使道
学位
现今,用计算机模拟物理系统热扩散的数值方法在传热学领域的研究中越来越受到重视。许多大型系统的传热过程分析与换热器的热计算都通过并行计算机的数值模拟实现。但传统上进
近年来,由于癫痫病的高发,癫痫的治疗已经成为了一项热门的研究课题。癫痫病虽然可以由药物治疗,但是,全球大概仍有30%的癫痫患者是抗药性癫痫并终身受其影响;而且,该类抗药性