基于情感词向量及卷积神经网络的舆情情感分类研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:littlerabit75
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分类方法发展至今,主要有两种流派:基于词典的方法以及基于统计学、机器学习的方法。基于词典的方法由于十分依赖情感字典的建立并且其构建成本较大以及不能够应对复杂多变的舆情情感信息从而限制了其应用,而基于统计、机器学习的方法能够非常好的克服此类问题,因此逐渐成为近些年来的主流。基于统计学的方法在处理情感分类问题中有两个关键的步骤:将非结构化的文本数据数量化以及选择适合的分类器进行训练。针对上述两个关键步骤,本文尝试将具有情感信息的词向量与卷积神经网络相结合来解决情感分类的问题。将结构化文本数据数量化的传统词向量方法无法捕捉到文本语料中的情感信息,因此本文采用了情感词向量的方法作为替代。本文中,首先在一个大规模数据集上利用无监督学习的方法训练得到不包含情感信息的词向量,再利用情感词向量模型在标注了情感极向的数据集上对得到的词向量进行情感信息的加工,由此我们得到了能够非常适合情感分类问题所需要的词向量。因为情感信息属于人类语言中较高层次的信息,所以传统的分类器在面对情感分析问题时不能够达到非常好的效果,而卷积神经网络利用卷积的操作可以非常好的将文本数据中较为抽象、高级的信息提取出来,并且池化的操作能够适应不同长度的文本,因此本文选用了卷积神经网络作为情感分类的分类器进行训练。本文的贡献在于将孤立的情感词向量方法与卷积神经网络相结合,设计了一个包含查找层、卷积层、池化层、输出层的四层卷积神经网络,再通过配合情感词向量应对大规模复杂舆情情感数据。通过将庞大数据集分批次进行迭代,不断地通过反向传播的算法更新参数来训练模型。在本文的试验中发现,该方法所得到分类效果相较于传统方法或者传统的词向量都有所提高。
其他文献
随着我国北斗卫星导航系统的发展,已经形成了“北斗+行业”融合发展的趋势。电力作为重要的能源支柱产业,与北斗系统的创新应用促进了电力系统的智能发展,提高了电力系统的管理水平。然而电力环境特殊,精度要求严格,其中,高精度接收机发挥着重要作用,关系到电力作业效率和系统运营的安全问题。在这种特殊的环境中,接收机性能能否满足电力要求尤为重要。本文以接收机的三个关键指标——定位、测速和时间精度为主要对象,研究
研究背景及目的肝细胞癌(Hepatocellular Carcinoma,HCC)是肝脏中最常见的恶性肿瘤。目前认为HCC的发生与多种因素有关,例如肝硬化、病毒性肝炎和各种化学致癌物等。由于缺乏典型症状,当发现HCC时,患者通常已进入中晚期。晚期患者常常由于肿瘤转移而失去手术治疗的机会,并且相较早期发现的患者,HCC的治疗效果明显降低。基因表达的失调是包括HCC在内的众多癌症的标志。在肿瘤的遗传机
随着互联互通技术的快速发展,网络金融的触角已经伸到了传统银行的核心业务领域,并已经引发了金融业的激烈竞争。网络金融借助科技的力量,轻型、便捷、低廉的特点,使得传统银
对于企业来说,竞争战略是企业开展对外贸易的主要力量,影响着公司的持续健康发展。SX公司作为我国一家著名的大型现代化煤炭企业,行业100强,长期以来主要以煤炭生产和经营为主业。近年,SX煤炭公司根据经济社会发展形势和自身需求设立了L物流公司,一方面旨在通过L物流公司提高公司运输能力,利用所在地显著的区位优势,建立现代物流体系。另一方面旨在将建立L物流公司作为经营方式转变的一次探索、尝试,从而推动SX
论文以均相橡胶沥青为胶结料,从材料性能、评价指标、混合料设计以及施工工艺等方面开展研究,使均相橡胶沥青超薄磨耗层具备良好的抗滑性能、高温性能以及抗水损害能力,以服
设M ∈Mn(Z)是一个整数扩张矩阵,D(?)Zn是一个基数为|D|的有限数字集.由仿射迭代函数系{φd(x)=M-1(x+d)}d ∈D确定的自仿测度μM,D是满足自仿恒等式μ=1/|D|Σd∈Dμoφd-1
随着国家现代化进程的发展,为满足现代城市轨道交通的大功率需求和缓解日益严重的城市交通压力,地铁车辆车体结构的轻量化问题已经成为研究人员所关注的热点。随着结构优化技术的越发成熟,国内外学者对轨道列车车体结构截面尺寸优化的研究也日趋完善,但是对于列车挤压型材截面的拓扑优化研究还处于发展阶段。对于复杂挤压型材的截面结构,仍然依靠研究人员的经验设计,如此很难设计出较好的轻型结构。因此,在保证地铁车辆车体结
目前,太阳能电池主要材料的禁带宽度普遍高于1eV,使得低于该能量值的太阳光不能被电池材料所吸收,太阳能电池对太阳光谱的响应范围很低,这也是制约太阳能电池转换效率的关键
随着电力系统的完善,电网输电设备的安全性和稳定性越来越受到学者和大众的关注。电力变压器作为整个电网中的中枢结构,电力变压器的缺陷会给人们的生活带来极大的不便,并且有可能造成重大的经济损失。并且随着泛在电力物联网技术的发展,电力变压器缺陷预测成为智能电网建设的重要问题。通过电力变压器的设备属性、运行环境等特征进行电力变压器的缺陷预测能取得很好的效果,但是电力变压器缺陷预测数据的不平衡性却是一个一直以
20世纪的意大利遭遇欧洲浪漫思潮的影响,以罗西尼、贝里尼、威尔第等为代表的闻名艺术家完成了对演唱的一个世纪的传承,创编了很多深度映射意大利国民的民族自豪感与热忱的歌曲。尽管歌剧传统在意大利由来已久,然而歌剧艺术家们并未忽视对艺术歌曲的创编,数目庞大的优质艺术歌曲也开始不断涌现。关于威尔第的艺术歌曲我国的民众接触得较少,即使在我国闻名的音乐大学,也仅有几曲经典曲目被颂唱。在威尔第的创作中艺术歌曲的创