基于深度学习的社交短文本情感分析研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:arile1027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,各类社交平台为互联网人群提供对某领域或者主题发表个人倾向观点的渠道,而这些社交平台对文本长度有一定限制,由此产生了大量来自社交平台的短文本情感信息。通过对这些短文本进行采集、处理、分析等方式可以预测其情感极性,并且经常被用于指导舆情分析、商业决策等。因此对这些社交短文本进行情感分析有着特殊的研究价值。本文研究基于深度学习的社交短文本情感分析方法,主要工作包括以下几个方面:(1)研究了情感词性对于文本情感分类任务的贡献,引入词性贡献因子并通过实验确定贡献系数,然后基于此提出针对情感分类任务的TF-IDF的改进算法TF-IDF-EW,该算法能够融合词性贡献和传统TF-IDF的优点,并计算文本中词汇的贡献权重。并且在该算法的基础上,加权Word2Vec词向量形成一种新的针对情感分析的短文本向量表示方法。(2)针对现有短文本向量表示法的缺陷,借助Word2Vec模型的特殊性和优点,结合(1)提出一种基于词性嵌入的BiLSTM-ATT情感分类模型:WTE-BiLSTM-ATT,该模型将Word2Vec模型与(1)中改进算法TF-IDF-EW结合,利用Word2Vec生成词向量然后与TF-IDF-EW进行加权计算得到融合词性贡献的词向量,然后通过BiLSTM层捕获上下文信息,并引入注意力机制,从而得到情感特征。对比实验结果表明该方法对情感二分类效果有提升,也验证了模型的有效性。(3)由于在社交短文本自身富含网络词、文本口语化、情感倾向强等特点下,其在细粒度情感分类上需求更复杂,性能要求更高,对此引入BERT对文本进行表达。首先构建了结合社交短文本特点的浅层特征的情感语言集,然后结合句法和语义的深层特征提出基于BERT的双通道情感分类模型(DC-BERT-ATT),该模型包含输入层、特征提取层、特征融合层和输出层,在结构上由两个信息处理通道组成:一侧为BERT-BiGRU-ATT通道,一侧为经过BERT微调输出层的BERT-FT-CNN通道。两个通道分别对深、浅层特征进行捕获,最后通过拼接获得情感特征。该模型通过参数实验找到最优值,其能有效的结合浅层特征的情感语言集和深层特征的句法和语义信息,并且通过模型对比实验在细粒度多分类实验取得最优效果,验证了该模型的有效性。
其他文献
实时、准确、可靠的行程时间信息能直观反映城市路网运行状态,是智能交通系统中智慧出行信息系统、智能交通管理系统等的重要支撑。城市道路网作为开放性路网,车流会受到车辆随机到达离开、信号控制方案等众多因素影响而呈现明显的间断流特征,导致城市道路路段行程时间估计相较于高速公路、快速路等连续流设施具有更大的不确定性。本文充分考虑间断流特征,基于车牌识别数据构建了一套新的城市道路行程时间估计方法。具体研究如下
山区相比于其他地区来说其地质环境更加复杂,地质条件也更加脆弱,山区在发展经济的过程中,会涉及到一些人类工程活动如道路工程建设等,这些工程建设与当地地质环境相互影响就可能导致山区地质环境问题的发生,人类活动愈频繁,山区地质环境所承受的压力就愈大,山区地质灾害就愈频发,对道路安全的威胁也就愈发显著。所以,基于GIS对某个山区案例进行地质灾害危险性区划及应用研究,在一定程度上有助于提高该山区地质灾害防治
“瓶颈”结构普遍存在于大型人员密集场所中(如出口、楼梯、狭窄通道等),也逐渐受到越来越多研究人员的关注。建筑内的“瓶颈”起到了连通建筑空间的作用,但一旦发生紧急灾难事件,它们成为疏散人员的阻碍。大量人员拥堵在瓶颈前可能会导致疏散效率的降低,造成碰撞、跌倒和踩踏等人身伤害。为此,本文从模拟仿真与可控实验两个方面探究了狭窄瓶颈处行人的转向行为和携带行李对行人流特性与疏散效率所产生的影响,针对房间出口“
医院作为城市中具有诊治和急救功能的机构,它的交通吸引性强,院前车流结构复杂,在高峰时期经常出现严重的交通拥堵,这在一定程度上会影响急救车辆和就诊人员的到达。大型综合医院院前有大量的停车需求,大部分停车者为就诊者,他们对步行距离较为敏感,当院内停车泊位已满时,停车者就会选择院前的路内停车。车辆的驶入驶出会给过境车辆带来延误,也增加了机非冲突,给非机动车的安全性带来了不利影响。同时如果无空闲泊位,部分
近年来,城市轨道交通因其快捷高效、安全舒适、节能环保的特点而发展迅猛,但仅靠车票收入难以负担运营支出;同时随着城市化进程加快,城市人口急剧增加,城市扩张规划也需要从以往的粗放式增长向精明式增长转型;城市资源向新城区转移也致使主城区城市设施部分老旧,正在逐渐丧失活力,主城区的城市更新亟待解决;随着私家车数量逐年增加,道路拥堵、尾气污染等城市交通、环境问题日益凸显。TOD(Transit-Orient
AlGaN/GaN异质结场效应晶体管(AlGaN/GaN HFET)具有高击穿电压,高电子迁移率和低导通电阻等优越特性,已经成为国内外研究的热点。然而目前氮化镓功率器件存在耐压能力与理论极限相差较远问题,如何在器件的其他特性尽可能少受影响的情况下提升AlGaN/GaN HFET器件的击穿电压是目前急需解决的问题。本文围绕实现AlGaN/GaN HFET器件高击穿电压进行研究,主要研究内容和成果如下
2012年发现的铋硫基超导体Bi4O4S3和La O1-xFxBi S2作为新型层状超导体引起了科学家的广泛关注。对于铋硫基超导体,科学家们认为载流子掺杂、面内化学压力或高压效应都有可能是诱导或增强超导电性的原因。本文主要对新型层状Bi SSe基材料La1-xOBi SSe和Ce1-xOBi SSe的制备工艺、结构、磁性和电输运性质进行表征和研究。首先,探究了采用固相反应法制备母相La OBi S
开槽双箱梁因具有良好的颤振稳定性而在大跨度缆索承重桥梁中得到越来越广泛的应用。然而,中央开槽的存在使得断面周围的流场异常复杂,容易引发涡激振动。本文基于节段模型风洞试验和CFD数值模拟,以某大跨度三塔斜拉桥为背景,研究了开槽双箱梁的涡振性能、抑振措施以及绕流特性。首先,通过1:70节段模型风洞试验研究了7种不同开槽尺寸双箱梁断面的涡振性能,总结了开槽双箱梁涡振振幅与开槽尺寸之间的相互关系:最大竖向
随着汽车保有量的增多,道路交通事故频发,每年造成大量伤亡。尤其在高速公路,交通事故死亡率高且更容易引发二次事故。近几十年来,越来越多的企业和学者关注到交通事故检测和分类,主要根据下游交通流变化、单车传感数据变化和视频数据进行事故检测,而这些方法实时性不高、可靠性较低或数据获取来源难度较大。所以,探寻一种快速且可靠的交通事故检测方法对缩短伤员救援时间及减少事故导致的财产损失具有重要意义,同时未来对交
随着我国城市化的推进,城市人口数量逐年提升,城市轨道交通需求量上涨,而规划背景导致部分轨道交通线路能力有限,造成了城市轨道交通系统中的客流需求与设备能力之间的供求矛盾关系。地铁运营方往往需要制定一套有效的客流控制方案,使城市轨道交通系统在既有的硬件条件下,安全、有序地发挥出最大的运输能力。本文对现有的客流控制方法经验进行总结概述,阐述车站级客流控制的思路、基本原则,并列举国内部分城市的车站级客流控