面向社交媒体的细粒度情感分析系统设计与实现

来源 :新疆大学 | 被引量 : 0次 | 上传用户:wmzxpl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网科技的飞速发展,越来越多的用户在社交平台上进行的言论、评论、交流等方式用来表达他们的态度和情感,也包括对产品、服务等各个方面的体验和评价的文本数据逐年的增长。因而对这些社交媒体平台上的海量的文本数据进行情感分析与挖掘有很大的实用价值,并逐渐成为一个热门研究方向。目前情感分析领域大多是针对情感极性的研究,采用传统的文本的情感分析的方法,基本上都是依靠繁琐的特征工程,将文本分为积极情感和消极情感,而针对文本细粒度的情感分析的研究较少。分析和研究文本中的情感在舆情监控和信息检索等领域都有着重要的现实意义和研究价值。针对如微博中的文本通常都具有稀疏性、接近重复性、口语化等特点的文本,分析和挖掘都是很有难度的。随着深度学习在图像、语音等领域取得的巨大的进展,将深度学习应用在情感分析任务上越来越多。在研究情感分析任务中,现有的深度学习在词向量处理上没有充分利用文本中表情符号的情感特征,且提取特征的所使用的模型通常基于神经网络,目前神经网络当要记住的“信息”比较多时,模型就要变得更复杂才能满足,因目前计算能力依然是限制神经网络发展的瓶颈;虽然采用局部连接、权重共享、池化等优化操作可以让神经网络变得相对简单一些,对模型复杂度和表达能力之间的矛盾有所缓解;但是,如循环神经网络中的长距离以来问题,信息“记忆”能力并不高。因此本文借鉴人脑的注意力机制,采取只选择一些关键的信息输入进行处理,提高神经网络的效率。因此本文按‘喜’,‘伤’,‘恐’,‘乐’,‘悲’,‘惊’,‘怒’,7种情感进行细粒度的分类,并采用基于情感融合的自注意力机制的文本情感分析模型。该模型将融合表情符号的语义合成向量,作为网络的输入层。再利用融合位置信息的自注意力网络提取高层文本特征训练分类器,完成在文本中建立词语间依赖关系以及获取多角度情感语义信息。实验结果验证了模型的可行性和有效性。本文采用了情感融合的自注意机制的文本情感分析模型,并利用层次结构进行情感分类;SVM是通用性强的机器学习方法,适用范围比较广。结合以上的方法特点和情感分类的目标任务。本文设计了微博文本进行细粒度的情感分类方案,首先使用SVM对文本进行主客观分类,情感融合的自注意力机制对判定为主观的情感文本进行每个句子的细粒度情感判断。本文的设计方案通过实验效果表明,该系统的实用性。
其他文献
碳基荧光材料在有机发光材料、金属离子检测和生物医学等领域展现出广阔的应用前景。本文从柠檬酸出发复合不同种类的含氮化合物合成了高量子产率的荧光聚合物(FPs)和荧光氮化
炭质页岩是一种强度低、易风化、易崩解的膨胀性软岩,开挖的炭质页岩路堑高边坡在空气中暴露时,随着时间的推移和水的侵蚀,岩体力学性质会逐渐发生变化,容易发生软化和崩解,
变压器是电力系统中复杂昂贵的电气设备,在电网中使用频繁,也是电网中容量较大、故障率较高的设备之一,一旦变压器出现故障,将对电力系统运行的安全稳定性产生重大影响,给国家和人民带来巨大的经济损失。因此,为了避免和减少变压器故障带来的损失,及时有效发现变压器潜在故障,进行变压器故障诊断研究就显得格外重要。针对传统神经网络在变压器故障诊断应用中,网络模型学习速度慢、诊断精度低、易陷入局部极值的缺点,本文对
随着经济全球化的发展趋势,国际市场竞争日益激烈,未来企业发展所面临的挑战更为严峻。企业可以利用自身的内部力量来谋求更好的发展,还可以采用外延式的发展来谋求更多的机会,开拓自己的市场,海外并购成为企业开拓市场谋求机会的首要选择。据普华永道的统计数据显示,近年来我国企业海外并购的规模在持续扩大,尤其在2016年,我国企业参与海外并购的数量与金额又一次被刷新记录。在中国“走出去”战略和改革开放不断深化的
近些年由于计算机技术高速发展以及互联网产生的大量数据,使得深度学习在计算机视觉、自动机器翻译、语音识别及自动驾驶等领域取得显著成果.就计算机视觉而言当下流行的识别算法如AlexNet[1]、VGGNet[2]、ResNet[3]等都需要在每类数千张训练样本的数据集上训练,才能得到较高的准确率.对于只有少量样本的其他数据集很难在此基础上微调得到较好的结果.这些限制使得深度学习在某些数据稀缺领域的应用
药物-靶标相互作用的发现是药物研发的首要工作。传统的实验方法虽然能够利用强大的药学理论来寻找药物-靶标相互作用的关系,但是其时间耗费较长、实验成本较高的缺点完全制
合成孔径雷达干涉测量(Interferometric Synthetic Aperture Radar,In SAR)结合了合成孔径雷达(Synthetic Aperture Radar,SAR)成像技术和干涉测量技术,在地表变形监测以及数字高程模型获取等方面具有覆盖范围广、重访周期短、精度高以及不受云层影响等突出优势。SAR影像配准是In SAR数据处理的关键环节之一,精确配准对于提高In SA
碳排放引起环境问题制约了中国的可持续发展。碳市场能够有效地降低社会整体减排成本并实现控制温室气体排放的目标,推进技术进步和产业结构升级。目前,中国政府正积极建设全国统一碳市场,并有望成为全球最大的碳市场。对于新兴的碳金融市场而言,市场信息效率是反映市场是否成熟的关键标志,对市场参与者制定交易策略至关重要。研究碳市场信息效率及其动态变化对建设统一碳市场有重大意义,有助于我们全面认识碳排放交易市场的发
大自然中存在丰富的对映体有机分子,例如氨基酸,乳酸,酒石酸等,因其廉价,无毒且容易获得是形成手性金属有机骨架(HMOFs)的理想化合物。然而,由于它们自身的柔性结构和体积过
知识经济时代的到来,为企业的发展提供了机遇与挑战。知识是由人所创造的,知识型员工不仅在知识经济发展中的贡献价值所占的比重越来越大,而且在企业发展的过程中所扮演的角色越来越重要,因此企业必须提高对知识型员工的重视。但是目前企业通常会面临员工流失、工作积极性不高等问题,这不仅与企业的性质、发展阶段等原因密切相关,而且反映出企业人力资源管理存在的问题,激励作为人力资源管理的重要环节,对解决企业上述问题具