基于深度学习的国产电影评论情感分析

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:zelda999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在跨国际文化交流方面,电影是一个国家文化软实力的重要体现,也是最直接、最有利的传播途径。伴随着中国电影市场的扩容与发展,国产电影作为我国文化和思想观念的反映与延伸,在增强文化自信、文化输出方面都扮演着极其重要的角色。经过移动互联网技术的深度介入,现代电影产业如猫眼电影、淘票票等互联网+泛娱乐服务平台已形成线上购票、线下观影、线上评价反馈的模式。其评价内容充分反映了观影群体的态度观点,对票房走向、文化的进一步传播都起着决定性作用。为了更好地把握观众的情感倾向,了解观影需求,提出国产电影制作建议,对电影评论进行情感分析和深层次语义挖掘十分有必要。由于对电影作品的评价考量了众多因素,具有复杂性和多变性,因而在情感分析过程中模型的选择十分关键。以深度神经网络为代表的深度学习模型对句子噪声的容忍度较高,具有强大的信息判别和特征自学能力,在情感分类任务中具有较大地优势。综上,针对国产电影评论,本文提出了一种新型数据集标注与划分方法,并将BiLSTM与CNN进行融合,利用CNN在提取目标结构特征和BiLSTM在提取远距离语义依赖关系的优势,构建出BiLSTM-CNN串行混合模型,为后续基于分类结果的特征可视化、主题提取和探究变量间关系提供更为可靠的支撑。以基于Python爬虫技术从猫眼网获取的40余万条国产电影相关数据为例,开展具体的研究工作,主要包括以下几个方面:第一,提出通过高分段评论和低分段评论分别构建评论数据的情感正负标签,筛选中间分数段作为候选预测数据集的数据划分方法。经过在长、短文本上的实验对比,发现本文方法相对于从中值对数据集进行正负情感切割的准确率、召回率和F值均有提升。第二,采用BiLSTM-CNN串行混合模型来捕获更为完整的上下文信息与局部语义信息,相比于单一模型具有更好的效果。在具体实验中,首先构建了TextCNN、BiLSTM和BiLSTM-CNN三个模型,然后借助Pytorch框架根据文本内容长度的不同、词向量初始化方式的不同进行对比试验,并从准确率、召回率和F值三类评价指标出发进行了分析。实验结果表明基于Word2Vec预训练词向量的BiLSTM-CNN模型具有较高的精度。将其他电影的文本评论进行输入测试,展示了其在电影评论文本中的可扩展性,具有较大的使用价值。第三,利用Word2Vec+BiLSTM-CNN模型对中间分数段的评论数据进行情感分类,将结果与原始标注数据合并后进行特征可视化分析并构建LDA主题模型,提取出潜在主题,探究评论的聚焦点,再综合分析两部电影不同市场反响度的原因。同时利用Logistic回归模型探究外在因素(如城市人均可支配收入和评价用户等级)对情感分类的影响。最后,从个人、电影制作企业和国家层面提出改进和建议,为创作出更多思想精深、品质精良的国产电影提供参考,以协助中国电影讲好中国故事。
其他文献
人民身心健康、长寿安康是国家富强、民族复兴、人民幸福的重要标志,医疗卫生事业是保障人民身心健康的重要民生事业,随着社会的发展,人们对医疗卫生保健与救治服务的需求逐渐缓慢提高,因而研究医疗卫生服务水平的高低就显得尤为重要。为什么在医疗卫生领域的财政支出总量和其在财政总支出中的占比都不断提高的情况下,城乡居民对医疗卫生服务、医疗卫生水平的满意度却没有得到相应的提高,反而有所下降呢?这是否与吉林省医疗卫
体质健康是一个世界性问题,也是一个世界性的难题,而且在不同的发展历史时期都会表现出不同的特点。与其它国家相比,我国青少年群体的体质健康十分严峻。近20年来,我国青少年体质健康的质量和形态虽然一直呈现出快速增长的趋势,而肥胖、视力不良持续上升,有低龄化的倾向,身体素质明显降低。在这种背景下,2016年国家下发《“健康中国2030”规划纲要》,要求进一步加大对学校健康教育的力度并纳入所有国民教育体系,
英语写作体现的是语言的建构,作为一项技能,它需要学习者具有对于篇章结构的处理能力和对内容的逻辑分析能力;它是对学习者外语综合能力的一种全面、客观的考查,能够充分地反映出学习者的外语水平。但当前在美术高中,英语写作教学中存在诸多问题:学生的作文结构混乱、内容不全面,学生不能够准确使用词汇、语法去进行内容的表达;教师对英语写作教学的关注度低、讲授方法单一,等等。这些问题导致学生对英语写作失去兴趣和自信
随着经济的飞速发展,有关教育平衡的发展不断加强,大众越来越追求教学的多元化发展。根据教育部门统计,当前中国各级各类私立民办学校的数量呈现迅猛增长的趋势,且占比近四成。在教育行业中,私立寄宿制学校越来越发挥着重要的作用。因此,对私立寄宿制学校的发展现状进行研究很有意义。本学位论文主要研究苏州市的私立寄宿制学校,对苏州市私立寄宿制学校自身的收费标准与之所提供的各种服务项目进行调查研究;并对调查结果进行
随着对外交流的日渐紧密,社会对应用型人才的需求逐渐增多。新建本科院校是新时期背景下向应用型本科院校转型的主力军,是培养应用型人才的主要力量。大学英语课程是高校课程改革转型阶段的重要组成部分。教育部颁布的《大学英语教学指南》(2017最新版)明确要求大学英语的教学目标是培养学生的英语应用能力,增强跨文化交流意识和提高英语交际能力,同时发展学生自主学习能力,提高综合文化素养,使他们在学习、生活、社会交
项目课程是一种以工作任务为中心,培养学生岗位职业能力的课程模式,因其打破了传统的学科课程模式,将理论与实践紧密结合而深受职业教育领域关注,在职业教育课程改革中受到极大关注,也是中职学校专业领域课程开发的科学选择之一。将项目课程模式引入中职学校,对丰富中职学校课程开发具有重要作用和现实意义。本文以项目课程模式为导向,依托柳州市第一职业技术学校、桂林市旅游职业中等专业学校作为实践基地,选取中职学校旅游
新手幼儿教师知道什么以及他们如何在教育教学活动中表达其所知,是优化新手幼儿教师培育体系的重要关注内容。本研究主要通过扎实的田野调查,参与式观察,访谈和谈话等方法采集资料,依托叙事研究为主的质化研究范式,以一名教龄刚满3年的江苏省某公办幼儿园的王教师作为研究对象,从人文视角出发,通过追踪教师成长经历中的典型故事,了解和感受一名新手教师在工作时遇到的危机、困境和坎坷,探究其是如何建构起属于自己的实践性
随着城市化进程不断加快,大量农村家庭开始涌入城市生活,因此流动儿童成为一个特殊群体。从熟悉的家乡来到陌生的城市,重新适应环境成为流动儿童首要的发展性任务。家庭系统是流动儿童适应系统中的微观系统,家庭功能对流动儿童社会适应有着重要影响。在陌生的学校环境和生活环境中,流动儿童是否能切身感受到来自教师和同伴的支持,对其适应社会也很重要。心理韧性是个体在面对不利情况下能够顺利并适应良好的特质。因此,本研究
在极紫外(EUV,5~40 nm)波段,由于光子能量已经大于大多数材料的带隙宽度,因而材料都表现出强烈的吸收性能。纳米级多层(ML)技术,通常由两种材料交替周期性叠加组成,利用光学干涉原理实现高效反射。但由于随波长的减小,所有材料的折射率接近于1,所以材料的光学对比度都很低。因此,在较短的波长(尤其是小于12 nm)如极紫外波段范围,可以实现光学应用的材料还很少。光子晶体是以周期性介电函数为特征的
本文以精益生产的理论为基础,从国内和国外的研究现状展开综述。首先,藉由文献探讨相关理论,针对国内外相关理论书籍、期刊、论文、研究报告、文献等资料,进行收集与学习研究,了解精益生产的相关理论。再采用个案研究法,以国内某中小企业M公司的DG系列割草机装配生产线为例。针对个案公司装配生产线导入精益生产管理模式进行研究。针对个案公司所做的“精益生产管理模式”活动推展和导入精益生产管理步骤:通过价值流图之分