【摘 要】
:
随着互联网技术的不断发展,各类信息不断朝着多元化与海量化的方向发展。对各类信息进行整理分析的需求呈现爆炸式增长。作为数据挖掘中的一项重要任务,文本情感分类逐渐成为
论文部分内容阅读
随着互联网技术的不断发展,各类信息不断朝着多元化与海量化的方向发展。对各类信息进行整理分析的需求呈现爆炸式增长。作为数据挖掘中的一项重要任务,文本情感分类逐渐成为相关领域的研究热点。传统的文本情感分类方法大都基于人工设计特征并进行提取的方法,但由于语义信息的抽象性,仅仅通过统计信息无法准确捕捉深层的语义信息。为解决这一问题,本课题基于长短时记忆网络(LSTM),设计了自动提取文本特征的文本情感分类模型,并开展实验研究。针对文本中语句较长,单词量较大,不利于语义信息提取的问题,本文采用分级网络结构思想,结合长短时记忆网络进行特征提取。利用文本“词-句-篇”的结构特点,对文本结构拆分,进行二次特征提取过程,首先以词为基本单位进行单词级的特征提取得到句子的特征向量,再以句子为基本单位进行句子级的特征提取得到篇章级的特征表示,从而实现文本的特征提取完成分类任务。针对长短时记忆网络在不同时刻所提取到的特征进行选择的问题,在网络编码阶段引入注意力机制,并结合分级网络结构思想,构建H-LSTM-AM模型;基于卷积神经网络对局部信息敏感的特点,将卷积神经网络(CNN)引入到句子级的编码中,构建LSTM-CNN网络模型。并通过实验证明了分级网络结构和注意力机制对分类模型性能提升的有效性。结合注意力机制完成分类模型的可视化处理,提取文中重要程度较高的词和句。针对数据中存在的样本分布不均衡问题,本文改进网络的损失函数结构以提升针对少样本量数据的关注程度;最后结合集成学习中的Bagging算法,通过对多个弱分类器的集成构造强分类器,并通过实验证明了Bagging算法对模型分类性能的提升。
其他文献
目的观察在重症监护病房中应用循证护理干预方法对导管相关性肺炎发生率的影响。方法整体选取2017年5月—2018年5月该院重症监护病房接收的患者54例为参照组,实施常规性护理
许多农民朋友在种植农作物时,往往对行向不加选择。其实,不同行向对农作物的生长发育及产量有着很大的影响。东西行向种植农作物,植株透光性和叶面积受光量增加,更能有效地
当前全球化现象引人注目,全球化已经成为世界上不可阻挡的发展趋势。本文对《宣言》产生的背景进行分析,梳理《宣言》内蕴含的全球化思想的具体内容,分析全球化对于政治、经
综述了国内对金线莲组织培养技术的研究现状,分别论述了不同外植体、基本培养基、培养条件、植物激素及其他添加物对金线莲离体快繁、原球茎诱导、愈伤组织诱导、增殖和分化
目的研究在产妇产后护理中采取舒适护理的临床效果。方法采取随机数字表法将本院自2016年4月至2017年4月收治的64例产妇随机分为参照组(n=32)与实验组(n=32),参照组产妇予以
新课标中明确提出,要学习生活中有用的地理和学习对终身发展有用的地理。这是一种探究式学习,中学地理教师可适当在地理教学过程中引入经典案例,创设情境,设置问题,引导学生
在现代企业中,控股股东和经营者拥有相当程度的控制权,作为有限理性的经济人,当合谋的净收益大于不合谋的净收益时,控股股东和经营者便会合谋,以攫取控制权私人收益,损害小股东的利
《红楼梦》中,仅仅一个"红"字就出现过许多次,人名、书名、地名、词曲和诗词中反复出现。而"红"字的涵义在中西方文化中的差异对其翻译构成巨大挑战,从巴斯奈特领军的文化翻译学
近些年我国保险事业的较快发展带来了新的变化,面对新情况、新问题,现行保险法在很多方面都不足以应对。在这种情形下,孕育多年的新保险法经过修订和审议终于出炉。本文对新
和谐一直是西方教育的理想追求,从其教育目标看,先后经历了灵魂和谐、自然和谐和社会和谐三个阶段。每个发展阶段的和谐教育课程和教学方法都因其哲学、心理学等学科基础不同而