【摘 要】
:
随着社交网络的快速发展,产生了大量的社交网络文本数据。社交网络文本的立场分析是针对某一话题所发表的评论,分析其对话题的同意与否,进而表明评论用户的立场是支持、反对或中立。立场分析在热点事件的舆情监测中具有重要的实际应用,成为把握热点话题的重要研究工具,可以为社会管理提供可靠的数据支撑与服务。传统的立场分析任务中,研究人员主要通过构建特征工程、情感词典等来挖掘文本语义特征,通过机器学习的方法来进行立
论文部分内容阅读
随着社交网络的快速发展,产生了大量的社交网络文本数据。社交网络文本的立场分析是针对某一话题所发表的评论,分析其对话题的同意与否,进而表明评论用户的立场是支持、反对或中立。立场分析在热点事件的舆情监测中具有重要的实际应用,成为把握热点话题的重要研究工具,可以为社会管理提供可靠的数据支撑与服务。传统的立场分析任务中,研究人员主要通过构建特征工程、情感词典等来挖掘文本语义特征,通过机器学习的方法来进行立场分类,在特征选择及其设计上需要花费大量人力。本文以社交网络文本立场分析为研究内容,提出了基于深度学习的社交网络文本立场分析方法。本文采用“分而治之”的词向量空间策略训练了五个话题的子向量空间作为词向量嵌入,研究了不同分词工具、不同词向量空间对实验结果的影响。提出了基于注意力卷积神经网络的社交网络文本立场分析方法,将注意力池化与最大池化策略、平均池化策略进行了对比分析研究。实验结果表明,本文提出的基于注意力卷积神经网络的社交网络文本立场分析方法相比较传统的最大池化、平均池化策略,宏平均值分别提高了5.97%和7.3%,显示出基于注意力卷积神经网络的方法优于传统的池化策略。本文在充分分析双向长短时记忆网络、一维卷积神经网络以及注意力机制优点的基础上将三者进行融合,提出了基于注意力融合神经网络CNN-ATBi LSTM的深度融合模型,解决了单卷积神经网络无法获取全局语义信息和传统循环神经网络梯度消失的问题。该模型兼顾局部特征与整体文本语义信息,有效提取话题评论文本的信息,后期采用注意力机制对文本的有效局部信息分布权重,最终得到社交网络文本的特征向量。该方法在NLPCC-2016 Task4公开数据集上的实验结果表明,该模型在五个子话题中的其中四个子话题性能超过了最优评测成绩,总宏平均值超过最优值1.72%。该结果验证了本文提出的方法在社交网络文本立场分析中的可行性与有效性。
其他文献
我国城市正处于经济和社会转型的关键时期,无手续开工建设、无资质进行施工、装饰装潢擅自拆除或破坏承重结构等城市建设违法行为愈演愈烈。大量的城市建设违法的产生严重扰乱了城市的建筑市场,严重影响了城市的建设规划,造成了城市建设资源的浪费。同时这些违法行为带来的工程质量隐患也影响了城市的公共安全。我国行政法提出,共同构建符合社会主义建设需求的监察模式,加强对城市违法建设的综合治理、消除城市内的违法建设、打
近年来,随着社会的高速发展,科技类数据的数量以及结构日渐复杂,为更好地对各种历史数据进行整理,满足业务要求,提升数据查询和分析处理的效率,本文依托“河北省科技创新大数据标准化处理与应用研发”和“河北省科技创新大数据公共服务平台”项目,提出了一种基于科技领域多源异构数据的本体重构与映射方法。论文的主要工作如下:(1)基于混合神经网络文本分类的多源异构数据的本体重构通过分析科技大数据的数据特点,为了解
优秀高管是企业宝贵的人力资源,保持高管团队的稳定高效是企业获取持续竞争优势的关键所在。然而,人才流动是不可避免的事实,尤其是新三板挂牌企业。高管离职或变动将直接影响高管个人任期,并改变高管团队的任期分布。因此,高管团队任期成为高管团队研究的热点。然而,学者们主要将任期作为高管团队人口统计特征的一个或两个自变量展开研究,且对其与企业绩效的作用机制缺少全面的剖析。本文从研发投入和营销投入入手,探索与验
目前,全球人口老龄化问题日益凸显,加之服务业向智能化方向发展,催生了对服务机器人的市场需求。服务机器人工作的行人环境具有非结构化和高度动态变化的特点,非结构化指行人构成的障碍物环境的物理形态持续变化;高度动态变化指该变化的时间尺度可达分钟级甚至秒级。这给移动机器人轨迹规划算法的设计带来了极大的挑战,比如如何提高行人位置估计的准确性、如何协调轨迹规划算法的安全性和高效性。现有的解决方法聚焦于滤波估计
随着网络技术的发展和信息交换的日益频繁,信息安全技术变得越来越重要,而基于混沌系统的新型密码也受到了越来越多的关注。作为新的密码技术,已引起国内外学者浓厚的兴趣和广泛研究。混沌作为一种特有非线性现象,拥有复杂的动力学行为特性,如:良好的伪随机特性、轨道的不可预测性和对初始状态参数的极端敏感性等,这些特性与密码学的许多要求是相吻合的。现已有大量的研究结果发表,混沌分组密码的研究是近年来研究最多的领域
医学图像分割是医学图像处理领域中的一项基础任务,其目的是提取医学图像中的感兴趣区域(Region of Interest,ROI)辅助医生诊断疾病。使用深度学习方法从医学图像中自动分割器官、组织或者肿瘤区域成为研究热点。利用卷积神经网络(Convolutional Neural Network,CNN)实现医学图像分割是目前最重要方法之一。基于CNN的分割网络从原始图像中提取像素特征,根据特征对像
人才是国家继续向前发展的重中之重,对人才的培养也是党和国家政策的重要方向。人才的培养,归根到底,在于培养人才的学习能力。学习能力,即在生活中体现出的能力,比如说,注意力、观察力、记忆力等,而在这多种能力当中,注意力是关键一环,也是一切活动的开始与基础。以学生的注意力表现情况为刻度量化学生的学习能力是合理培养人才的重要方面,因此,对注意力评价的模型研究并将注意力评价模型成功应用到系统中也就显得越来越
通过分析电极消耗的机理,结合我公司富锰渣矿热炉不同生产工艺的实践经验,对比碱性渣和酸性渣不同渣系、典型锰矿不同还原剂配入量对电极消耗的影响,总结出影响电极消耗的主
数字人事管理体系是税务系统创新行政管理方式的重要手段,也是提高税务干部工作积极性、增强内部管理效能的重要保障。牡丹江市C区税务局按照国家税务总局的部署,在积极推进落实过程中,结合工作实际,形成了自身的数字人事管理体系,但在管理主体、管理制度、指标设计和数据结果运用等方面还需进一步完善。本文通过采用文献分析法、调研分析法等研究方法,首先以公务员管理、绩效管理理论为基础支撑,以数字人事管理体系涵盖的主