基于深度学习的情感倾向与互动率预测的研究与应用

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:zyhpeter2011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的不断进步以及电子产品的全民化普及,网络上代表着用户情感和观点的短文本内容呈现爆炸式的增长,传统的基于深度学习的中文情感倾向分类方法无法完全挖掘出这些评论的商用价值。为此,本文研究了中文评论短文本的情感倾向以及与互动率的关系,并设计实现了一个评论情感倾向与互动率预测系统。本文针对电影新闻相关的在线短文本评论数据,首先提出了一个基于LSTM的前融合情感倾向分类模型PF-LSTM,实现了不同场景下评论文本的情感倾向分类;其次,结合上述情感倾向分类模型的输出结果,提出了一个基于RNN的评论互动率预测模型CIRP-RNN,以获得评论情感倾向与评论互动率之间的关系;最后,基于上述两个模型,本文设计开发了一个评论情感倾向与互动率预测系统,以帮助用户分析评论氛围和制定高收益的评论策略。具体研究内容如下:本文首先介绍了本课题的研究背景与意义,对情感倾向分类和回归预测的国内外研究现状进行了分析。其次,采用统计分析和基于半监督机器学习的方法,对本文后续研究将使用的数据集的有效性进行了分析与验证。实验结果表明,本文使用的数据集能够有效地应用于本文的后续研究工作。接着,本文提出了基于LSTM的前融合情感倾向分类模型。该模型通过Word2vec构建词向量矩阵,利用情感词标签修正情感词向量,突出中文评论文本句子中情感词的情感倾向信息,并且将评论场景作为一个输入特征,融合到评论句子特征向量中,实现不同场景下中文评论短文本数据的情感语义分析。实验结果通过分类精确率、召回率和F1值的比较,表明了本文所提出的PF-LSTM模型不仅解决了情感词向量无法突出情感信息的问题,而且相比于传统的LSTM中文情感倾向分类模型,减少了分类时间复杂度,提高了情感倾向分类准确性。然后,根据回归预测原理,本文提出了基于RNN的评论互动率预测模型,并研究了评论的情感倾向、评论的内容长度以及评论的展现位置与评论互动率的关系。模型实验结果表明,基于RNN的评论互动率预测模型拟合评论互动率数据效果较好,能够有效地对评论互动率进行预测。接着,本文分析了评论情感倾向与互动率预测系统的目标及功能需求,划分了系统模块,设计了系统的数据库。最后,介绍了系统开发环境及工具,搭建了系统实现框架,详细描述了系统各个模块的实现过程,给出了相应的运行效果截图。
其他文献
爱德华·萨义德因后殖民主义批评闻名于学界,其晚年之作《论晚期风格:反本质的音乐与文学》虽然也被许多人提及,但对它的专门研究却显得薄弱。笔者认为,“晚期风格”理论属于萨义德后期研究重心产生偏移的代表之作,也是他阐释文学/艺术家及其作品的一个重要理论视角。他笔下的晚期风格人物群像或在作品形式上藏巧于拙、或令人不解地在美学风格上倒退回传统,以及执拗地选择与所处时代的价值理念相抗衡,将自己放逐到边缘的境地
随着交通运输行业的飞速发展,交通工具运行速度稳步提升,与空气的相互作用不断加剧,流固耦合问题日益严重,运动部件的气动特性与动力装置的能源利用效率成为交通运输行业亟待解决的关键问题。与此同时,随着空气动力学研究的深入,边界层理论在解决气动特性问题上受到了广泛关注,并为流动控制技术提供了丰富的理论支撑。作为基于等离子体气动激励的一种新型主动流动控制技术,沿面型介质阻挡放电(Surface Dielec
脉冲神经膜系统(SNP)是一种受生物神经元以脉冲的方式传递信息的机制启发设计的神经计算模型,属于第三代人工神经网络。SNP应用潜力巨大,研究SNP的学习算法可以构建一个机制更加符合人脑模型的学习框架,但是将其应用在模式识别领域一直是一个未被完全解决的公开问题。本文以数值型脉冲神经网络为出发点,结合SNN中的成熟的学习算法、网络结构,以及马尔可夫决策过程的思想和强化学习方法,设计了两类数值型SNP学
云南电网与南方电网主网异步联网后,外送直流容量远远大于本地负荷水平,水轮机组占总装机70%以上,部分电网发电机组惯性降低,直流闭锁故障往往产生系统有功功率的不平衡,极易发生超低频振荡,云南电网中功角稳定问题转换为频率稳定问题。为了提高主网对云南电网频率稳定性的辅助调节作用,实际工程建设中在直流送端系统中加入频率限制控制器(FLC,Frequency Limit Control)与一次调频协调作用,
图像分割是一种关键的计算机视觉技术,其将图像的像素分为不同的具有区别性事务的块。多层次图像分割是图像分割方法的一种,可捕获目标的所有尺度,故被广泛运用到语义分割和区域建议生成等计算机视觉场景。多层次图像分割的结果可表示成树形结构,图像中目标根据分割粒度不同,分布在树中不同层次。尺度感知是从目标的多个分割尺度中捕获其合理分割尺度,是多层次图像分割方法实现图像分割的关键。本文基于已有多层次图像分割方法
20世纪20、30年代的摩登上海,是中西文化的交流场域,书籍设计作为一种文化载体不仅反映了时代的审美,更是成为那个时代的文化表征。文化的大熔炉也为中国现代书籍设计提供源源不断的创作资源,而叶灵凤作为那个文化场域的跨文化译介者,在受到从清末到民初繁杂的文艺思潮影响后,所做的书籍设计也成为了那个时代的表征。就将西方元素本土化的这一创造性过程,叶灵凤承担了一位审美现代性与启蒙现代性的推者,其创造性不仅在
网络是一种有用的模型工具,许多现实中的复杂系统都可以借助网络模型来进一步研究。社区是网络中一种重要的结构性质,它是由网络中联系紧密的节点构成的集合。同一个社区内的节点具有某种共性,因此社区体现了网络的局部特性,能够帮助人们挖掘和分析网络中所蕴含的知识。社区发现是检测网络中社区的主要方法,然而网络往往规模庞大且结构复杂,社区间的分界线不明显等为社区发现带来了巨大挑战。为了解决这些问题,本论文从重叠和
学位
轻型载货汽车在城市道路的公路运输中扮演着重要角色,而与此同时,消费者对载货汽车的品质有越来越高的要求,消费者越来越关注汽车行驶的平顺性与舒适性,使得车辆的振动性能成
乳腺癌是全世界范围内威胁女性健康最主要的癌症之一,而超声(US)是乳腺结节的主要影像学检查和术前评估之一。然而,在超声诊断领域,由于良性和恶性乳腺结节图像的相似表现形式,这使得诊断结果在很大程度上依赖于医生的经验判断。而且具有不同资历的医师的诊断准确性相差高达30%,因此,很容易导致误诊并增加不必要的穿刺活检率。近年来随着计算机科学的不断进步和医学方面的数据集的不断丰富,计算机辅助的医学诊断逐渐成